資訊機構 Navigant Research 最近公佈的報告再次將兩家公司推向風口浪尖。一個是在排名中墊底的特斯拉,另一個則是拔得頭籌的 Waymo。至於評判標準,是根據每家公司在「願景」、「商業化策略」、「合作方」、「量產計劃」、「技術」以及「產品持久力」這幾個方面的綜合表現打分排名。

(2019 自動駕駛領導力排行榜,來源:Navigant Research)

在去年的報告中,Waymo 和特斯拉的排名分別爲第七位和第十二位。對 Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都低。在一些業內人士看來,這份報告在成文的視角和方法論上略有偏差,缺失了對「政府關係」和「數據」這兩個重要標準的考量。

和政府搞好關係的重要性自不必說。一旦硬件實現商品化,軟件就成了關鍵。實際上不能說是軟件,而是「數據」。數據是驅動自動駕駛技術發展的「燃料」,或者如前英特爾首席執行官 Brian Krzanich 提出的觀點,「數據是新的石油資源」。世界上最先進的人工智能也需要數據支持——它依靠浩如煙海的數據將信息傳化爲下一步的行動。

顯然,如果只考慮「科技」和「數據收集」這兩個維度,排在榜首的應該是 Waymo 和特斯拉。至於誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關於特斯拉和 Waymo 在技術層面的一兩點差異性。

「貌合」「神離」的兩套方案

二月底,Waymo 首席科學家 Drago Anguelov 在 MIT 首次開講,他分享的內容主題爲「解決自動駕駛中的長尾問題」(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對 Waymo 自動駕駛研發目前能夠瞭解到的最深度、最詳細的內容了。

(Waymo 首席科學家 Drago Anguelov 在 MIT 開講自動駕駛課程)

近些年,使用大量標註過的數據對深度學習網絡進行監督訓練,使得物體感知和行爲預測能力有了大幅提升,這些技術在 Waymo 自動駕駛開發過程中得到了大規模應用。我們也從 Drago Anguelov 口中第一次知道了 Waymo 在使用「模仿學習(imitation learning)」,這裏先稍微科普一下。

模仿學習屬於機器學習的一種,它的神經網絡能夠通過「觀察」人類的行爲將某些特定的動作和場景進行匹配。如果使用不同類型的「人類行爲」作爲數據源來訓練,最終神經網絡就能夠根據感知的結果輸出相對應的決策動作。例如,「如果你看到停車標誌,馬上停車」、「如果前方有輛停着的車擋路了,繞開它」等等。

(「行爲克隆」(behaviour cloning)與「模仿學習」(imitation)是一回事)

隨着商業化試運營的推進,谷歌能夠採集數據的場景更多了,模仿學習算法也就有了更頻繁的用處。但 Drago Anguelov 也指出,人類駕駛行爲存在着很多不確定性,一些罕見的場景(所謂的「長尾」問題),Waymo 的數據集中並沒有足夠的案例來訓練算法應對。出現這種情況就只能依靠開發人員手動編寫算法。Drago 認爲這種「折中」的做法遲早是會被機器學習代替的。

根據 Waymo 官方披露的數據,Waymo 目前已經累積了約 1500 萬英里的行駛里程。按照平均每 3000 萬英里纔會出現一起事故的概率來計算的話,Waymo 可能到現在都沒有得到一個特定的「長尾」案例。假設行駛每 100 萬英里會發生一起事故,waymo 也不過積累了 15 個數據而已。按照普通機器學習神經網絡需要的數據量(每個圖像分類需要至少 1000 個樣本)的標準來看,Waymo 似乎還差得有些遠。

儘管 Drago Anguelov 表示希望通過採集儘可能多的人類駕駛行爲(包括「長尾」案例)來進行模仿學習,但「數據量的缺失」是個很大的問題。

而爲了彌補這方面的缺陷,Waymo 已經構建出了一套仿真模型,仿真出儘可能多的場景來進行測試。因爲有時會得出截然相反的結果,所以要加強系統的魯棒性,做出足夠多的仿真模型,確保系統的準確性。

(仿真測試是自動駕駛研發中的關鍵一環)

不過仿真模型的建立依然需要真實世界數據的支持,解決「長尾」問題也需要對人類駕駛行爲進行大量地模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級「數據」的支持。

對比之下,似乎「差生」特斯拉在「數據」問題上還真是不發愁。

特斯拉目前預計有超過 40 萬輛搭載了 Autopilot 系統的車子在道路上行駛,單日行駛里程超過了 1300 萬英里。如果未來這個車隊的規模增加至超過 100 萬輛,那麼每月產生的有效行駛里程將到達 10 億英里的量級。對一家已經有成熟產品落地的車企而言,這種真實世界產生的「數據」根本不是問題。

(特斯拉 Model 3)

至於特斯拉在自動駕駛研發上的獨特性,根據外媒The Information曾經透露的信息,特斯拉同樣在利用「里程累積」上的優勢進行模仿學習。原文(https://0x9.me/yRgBO)是這麼說的:

不過按照個人的理解,特斯拉軟件工程師提到的「行爲克隆」和 Waymo 的「模仿學習」是一個意思,等同於大家都在講的「端到端學習」的方案,即使用一個巨大的神經網絡,輸入傳感器數據後得到關於轉向、加速和剎車的整體執行策略。

假設特斯拉採用的是端到端學習方案,那它肯定是不需要對圖像進行標記的。唯一需要「標記」的是人類駕駛員的行爲,比如轉向角是多少、加減速的力度等。將整個傳感器數據輸入到一個巨大的神經網絡後,系統會學習如何將傳感器數據與人類駕駛員的行爲進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發考慮,它採用的就不大可能是和 Waymo 一樣的「端到端學習」的策略。

(「端到端」與「語義抽象」的差異)

針對自動駕駛感知的算法差異,Mobileye 創始人 Amnon Shashua 曾經對「端到端學習 (End-to-End Learning)」和「語義抽象(Semantic Abstraction)」這兩個概念做過詳細的講解。

(Mobileye 創始人 Amnon Shashua 對自動駕駛感知的內容進行了講解)

而根據外媒The Information報道的內容來推斷,特斯拉可能是在開發一套用於路徑規劃或執行控制的神經網絡。而用來訓練這套神經網絡的數據並非來自傳感器,而是由感知神經網絡輸出的元數據。這樣人類駕駛員的直接行爲—轉向、加速和剎車可以對元數據進行「標記」,類似端到端學習中,駕駛行爲與傳感器數據的匹配。

這種將感知層和執行層神經網絡分開的做法能夠規避 Shashua 教授上面提到的端到端學習可能產生的一系列問題:如「不常見場景」出現的機率會大幅下降;對先備知識(Prior Knowledge)的要求提高,深度神經網絡在解決一些簡單問題上可能會「慘敗」。

(「端到端」機器學習的侷限性)

假設特斯拉用於訓練的數據來自特斯拉車主,通過人工的方式將一些「壞的」行爲去掉,這樣可以避開人工編碼算法的侷限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監督學習來進一步優化。可以把路徑規劃或執行控制的神經網絡放在運行 Autopilot 或其他駕駛輔助功能的車子上,一旦出現系統脫離、失效、碰撞等情況,工程師就可以通過 bug 報告來定位原因。這些「錯誤」之後還可以用來訓練新的神經網絡。

如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規劃和執行控制方面的問題。考慮到目前搭載硬件 2.0 版本的特斯拉車型每個月可以獲得近 10 億英里的行駛里程,獲得的數據量之大是 Waymo 無法企及的。之後硬件 3.0 版本上線後,搭載了 AI 芯片的這套系統會更有利於特斯拉算法的迭代。

一場馬拉松式的長跑

儘管Waymo深受「數據」的困擾,但光憑對這個維度的考量自然是沒辦法斷言什麼的。只不過Waymo要解決自動駕駛中的「長尾」問題,自然需要更多的數據支持。Waymo近日宣佈將在亞利桑那州的梅薩市開設新的技術服務中心,進一步擴大無人車出行服務的規模。顯然Waymo是奔着蒐集更多「數據」的目的來的。

(基於克萊斯勒 Pacifica 車型打造的 Waymo 自動駕駛原型車)

也有人認爲,Waymo可以效仿特斯拉開發一套類似Autopilot的駕駛輔助系統,僅使用成本低廉可量產的傳感器。一旦在市場鋪開後,蒐集真實場景的駕駛數據也就不是什麼難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領域的合作伙伴。

上週有消息稱,「Waymo正在尋求外部投資人」。意料之中的計劃。如果有車企成爲Waymo的股東,要獲得海量的駕駛數據自然容易得多。而且Waymo作爲自動駕駛解決方案的供應商,始終只有藉助OEM的平臺才能最終獲得商業化成功。不管是手中的全棧自動駕駛技術亦或是正在進行的移動出行業務,Waymo對很多車企而言,都是有十足吸引力的合作伙伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。

對特斯拉而言,之前因爲Model 3陷入「量產地獄」,Autopilot的研發進程似乎出現了停滯,硬件3.0也遲遲沒有發佈。儘管在「數據」容量上有先天優勢,但率先量產以及頻發的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。

(特斯拉創始人 Elon Musk 首次發佈 Autopilot 系統)

不過我個人倒是蠻欣賞之前馬斯克說過的一段話。

他說,「我不認爲哪家企業能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何車企都不是我們的競爭對手」。

希望這種「目中無人」的狂妄自大,可以給特斯拉帶來點好運氣。

責任編輯 臥蟲

圖片來源 視覺中國、特斯拉官方、演講視頻截圖

相關文章