回應激光雷達、脫離、AI人才等熱點爭論

作者:Trent Eady

發表於5月30日

解決自動駕駛汽車相關問題需要利用神經網路,包括計算機視覺、預測道路使用者的行為,以及規劃和執行駕駛任務。增加訓練數據能夠優化神經網路。在眾多自動駕駛汽車製造商中,只有Tesla能夠利用數十億英里的測試數據來訓練神經網路。在這方面,Tesla遠勝其他製造商。因此,Tesla在自動駕駛汽車領域的成就將會超越任何其他製造商。

當我提出這一觀點時,許多人以Waymo為例進行反駁。其中,我聽到最多的觀點是:

· 「自動駕駛汽車需要使用激光雷達。」

· 「Waymo要比Tesla領先許多年。」

· 「谷歌和DeepMind是機器學習領域的全球領導者,因此Waymo是自動駕駛汽車領域的領導者。」

· 「Waymo的自動駕駛脫離率最低。」

· 「Waymo已經開始運營自動駕駛計程車業務。」

如果仔細分析這些觀點,你將能夠找到令人信服的理由,並據此提出質疑。

「自動駕駛汽車需要使用激光雷達。」

簡短回應:許多重要的東西是激光雷達無法發現的,只有通過攝像頭才能發現。不論是否使用激光雷達,基於攝像頭的計算機視覺必須足夠強大。如果計算機視覺足夠強大,那就不一定需要使用激光雷達。建立強大計算機視覺的最佳方案是放棄激光雷達,轉而使用規模化數據進行訓練。

詳細回應:激光雷達主要用於測量深度,而駕駛環境下的許多重要功能並沒有任何深度。有些是採用標線油漆:車道線、停車線、轉彎箭頭和人行道。有些是採用光信號:剎車燈、轉向燈、危險警告燈和交通信號燈。還有其他各種標識。為了確保駕駛安全,自動駕駛汽車需能夠以高精度識別所有功能,而這一點只有攝像頭纔能夠做到。

如果基於攝像頭的計算機視覺在識別無深度功能方面不夠準確,那麼激光雷達也無濟於事。如果計算機視覺足夠準確,那麼激光雷達的必要性就會受到質疑。如果僅憑攝像頭就足以識別無深度的東西,那還會有什麼能夠妨礙攝像頭識別有深度的東西呢?

激光雷達的解析度太低,無法識別細小的事物特徵,例如行人的面部表情或更細微的肢體語言。攝像頭可以接收視覺線索,而神經網路可以通過攝像頭預測行人運動。此外,激光雷達可能也無法區分塑料袋(安全)和煤渣塊(危險)等較小的障礙物。

使用激光雷達並不妨礙使用攝像頭。不過,目前的激光雷達價格確實對攝像頭的大規模使用造成了影響。最終,激光雷達的價格將會有所降低,但(雖然並非當前)如果你希望為100萬輛汽車安裝攝像頭,你就不能同時再安裝激光雷達。(至少不能安裝Waymo所採用的高級激光雷達。)如果路上有100萬輛(自動駕駛)汽車,這將有助於通過增加訓練數據來解決基於攝像頭的視覺問題。在解決這些問題後,就不需要激光雷達了。如果無法解決這些視覺問題,激光雷達也於事無補。既然如此,為何不盡最大努力去解決基於攝像頭的視覺問題呢?

「Waymo要比Tesla領先許多年。」

簡短回應:Waymo好像是從2015年才開始使用深度神經網路的,因此距離其首次使用的時間差不會太大。

詳細回應:深度神經網路是自動駕駛汽車的基礎技術。如果沒有深度神經網路,自動駕駛汽車就不可能實現。(即使有了深度神經網路,自動駕駛汽車也可能無法實現。讓我們拭目以待。)Waymo成立於2009年,而深度神經網路是在此幾年前才開始在AI研究領域普及的。如果深度神經網路沒有經歷快速發展,Waymo可能永遠也無法走出谷歌X實驗室。

Waymo於2015年首次嘗試將深度神經網路應用於行人檢測。首個基於深度神經網路的系統的性能遠超先前系統百倍。如何讓計算機視覺超越人類視覺仍然是一個懸而未決的挑戰。由於舊技術的性能相差百倍,這一問題似乎難以得到解決。

Tesla在2016年之前就開始應用深度神經網路來解決計算機視覺問題。2017年,Tesla部署了第二代Autopilot(自動輔助駕駛系統)。Autopilot採用了Tesla自行開發的計算機視覺神經網路。在這方面,Waymo將深度神經網路應用於自動駕駛的時間似乎只有一年,也可能不到一年。Waymo採用相關技術的時間不足七年,這從其創立日期就可以看出。

相較於計算機視覺,在將深度神經網路應用於實際駕駛行為方面,其相關工作的歷程更短。2013年,DeepMind通過展示在Atari遊戲中的效果推廣深度強化學習。同樣,Waymo的早期計算機視覺系統可能永遠無法充分發揮作用,我個人懷疑早期的許多手動駕駛行為編程工作最終都會被廢棄,轉而採用基於神經網路的方案。自動駕駛汽車的研究人員和工程師似乎越來越熱衷於深度強化學習和深度模仿學習等概念。

「Google和DeepMind是機器學習領域的全球領導者,因此Waymo是自動駕駛汽車領域的領導者。」

簡短回應:Waymo開發小型自動駕駛汽車可能需要機器學習研究人員取得新的根本性突破。相比之下,Tesla的方案僅僅是擴大現有方案的規模,而這些方案本身已經在其他應用中獲得了成功。

詳細回應:奧運會金牌得主的實力強於銅牌得主或排名第五的選手。但這些僅為增量差異。就像強迫Usain Bolt穿上踝部加重袋,從而讓其他選手超越他。如果競爭是公平的,能夠做到最好就足以取勝。

但Waymo與Tesla之間的競爭並不公平。Waymo正在嘗試利用少量數據解決機器學習問題,而Tesla正在嘗試利用大量數據解決同樣的問題。利用大量數據解決問題是當代機器學習的做法,而利用少量數據解決問題是一項懸而未決的研究問題。如果谷歌或DeepMind能夠取得必要的突破,使利用Waymo的少量數據開發出的神經網路在性能上能夠超越利用Tesla的大量數據所開發出的神經網路,則其影響將超越自動駕駛汽車領域,走向整個機器人技術領域以及機器學習的其他應用領域。這將產生重大影響,讓我們拭目以待。

由於Tesla車隊每月行駛里程數約為Waymo車隊的400倍。對於某一類情形,Tesla車隊每年可能遇到1,200次,而Waymo車隊僅遇到三次。研究人員正在研究一次性模仿學習等方案,以讓自動駕駛汽車從某一個案例或少數幾個案例中學習。目前,這仍然是一項懸而未決的問題。另一方面,我們已經能夠證明DeepMind的AlphaStar等概念,其表明如果通過大量人類示範和大量反覆試驗和錯誤對智能主體進行訓練,則智能主體可以通過模仿學習和強化學習掌握複雜的行為。利用大規模數據進行訓練在當前環境下是有效的,而利用小規模數據進行訓練可能會在未來實現。

任何規模的數據收集(即使是涵蓋全球所有汽車的數據)是否就足以用於通過現有技術解決自動駕駛問題,這仍然是一個懸而未決的問題。如果Waymo的規模不足以解決這一問題,那麼Tesla可能也無法解決。那麼,為何還要去區分Waymo與Tesla呢?

我們並沒有強有力的證據,但我們確實能夠管中窺豹。我們可以對比星際爭霸(StarCraft)的數據規模,繼而發現Tesla車隊亦是如此。AlphaStar的訓練涵蓋「幾萬年」的連續行駛數據,而Tesla車隊每年都會獲取「幾萬年」的連續行駛數據。DeepMind每年利用200年的行駛數據訓練300個版本的AlphaStar,共計60,000年。而Tesla每天每小時駕駛50萬輛汽車,每年可獲得2萬年的行駛數據。相比之下,Waymo車隊每年的行駛時間不到500年,並且其全部歷史數據不足500年。

「Waymo的自動駕駛脫離率最低。」

簡短回應:向加州機動車輛管理局(DMV)報告的脫離率並非總脫離率。我們也沒有Tesla的相關數據可用於比較。

詳細回應:Waymobeta測試員Reid Beer表示,人類安全駕駛員「約每五次行駛」就會接管一次。如果平均行駛路程約為8英里,則每40英里就會出現一次脫離。這與向加州機動車輛管理局報告的每11,000英里一次的脫離率相去甚遠。差距在哪呢?

加州機動車輛管理局並未要求提交總脫離率,而僅要求提交與安全相關的脫離:如果安全駕駛員不進行幹預,就可能發生碰撞的情形。顯然,安全相關脫離僅在總脫離中佔很小的比例。

僱員必須評估脫離是否與安全相關,而這屬於主觀判斷。例如,Cruise認為闖紅燈不屬於安全相關的幹預因素。

Tesla並沒有在加州的公共道路上開展加州機動車輛管理局所說的完全自主測試,因此Tesla並沒有向加州機動車輛管理局報告任何相關數據。因此,我們無法比較Waymo和Tesla的安全相關脫離率(即使我們可以保證其僱員評估安全相關脫離的方式相同)。

「Waymo已經開始運營自動駕駛計程車業務。」

簡短回應:讓試運行測試員進行試駕本身並不能體現出技術能力,也不會對技術進步做出貢獻。

詳細回應:任何公司在公共道路上測試自動駕駛汽車原型時,都可能將非己方的僱員安排在後座。為何呢?因為這會增加責任、不便和開支,並且絕對無法提升自動駕駛汽車的視覺能力,更好地預測道路使用者的行為,或做出更好的駕駛決策。Uber利用自身的原型車搭載匹茲堡的乘客行駛了有限的時間。許多公司偶爾會安排坐在後座的非己方的僱員進行試駕。Waymo的試乘規模最大,但這並不一定意味著Waymo的技術最先進。


推薦閱讀:
相關文章