特斯拉和 Waymo 在模擬和現實世界中已經積累了最多的行駛里程。


我固執的老爸認為比亞迪世界第一,我該如何改變他的想法


「差生」特斯拉和「頭牌」Waymo,做自動駕駛有什麼不同?

至於誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關於特斯拉和Waymo在技術層面的一兩點差異。

資訊機構 Navigant Research 最近公布的報告再次將兩家公司推向風口浪尖。一個是在排名中墊底的特斯拉,另一個則是拔得頭籌的 Waymo。至於評判標準,是根據每家公司在「願景」、「商業化策略」、「合作方」、「量產計劃」、「技術」以及「產品持久力」這幾個方面的綜合表現打分排名。

(2019 自動駕駛領導力排行榜,來源:Navigant Research)

在去年的報告中,Waymo 和特斯拉的排名分別為第七位和第十二位。對 Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都低。在一些業內人士看來,這份報告在成文的視角和方法論上略有偏差,缺失了對「政府關係」和「數據」這兩個重要標準的考量。和政府搞好關係的重要性自不必說。一旦硬體實現商品化,軟體就成了關鍵。實際上不能說是軟體,而是「數據」。數據是驅動自動駕駛技術發展的「燃料」,或者如前英特爾首席執行官 Brian Krzanich 提出的觀點,「數據是新的石油資源」。世界上最先進的人工智慧也需要數據支持——它依靠浩如煙海的數據將信息傳化為下一步的行動。 顯然,如果只考慮「科技」和「數據收集」這兩個維度,排在榜首的應該是 Waymo 和特斯拉。至於誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關於特斯拉和 Waymo 在技術層面的一兩點差異性。

「貌合」「神離」的兩套方案

二月底,Waymo 首席科學家 Drago Anguelov 在 MIT 首次開講,他分享的內容主題為「解決自動駕駛中的長尾問題」(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對 Waymo 自動駕駛研發目前能夠了解到的最深度、最詳細的內容了。

(Waymo 首席科學家 Drago Anguelov 在 MIT 開講自動駕駛課程)近些年,使用大量標註過的數據對深度學習網路進行監督訓練,使得物體感知和行為預測能力有了大幅提升,這些技術在 Waymo 自動駕駛開發過程中得到了大規模應用。我們也從 Drago Anguelov 口中第一次知道了 Waymo 在使用「模仿學習(imitation learning)」,這裡先稍微科普一下。模仿學習屬於機器學習的一種,它的神經網路能夠通過「觀察」人類的行為將某些特定的動作和場景進行匹配。如果使用不同類型的「人類行為」作為數據源來訓練,最終神經網路就能夠根據感知的結果輸出相對應的決策動作。例如,「如果你看到停車標誌,馬上停車」、「如果前方有輛停著的車擋路了,繞開它」等等。

(「行為克隆」(behaviour cloning)與「模仿學習」(imitation)是一回事)

隨著商業化試運營的推進,谷歌能夠採集數據的場景更多了,模仿學習演算法也就有了更頻繁的用處。但 Drago Anguelov 也指出,人類駕駛行為存在著很多不確定性,一些罕見的場景(所謂的「長尾」問題),Waymo 的數據集中並沒有足夠的案例來訓練演算法應對。出現這種情況就只能依靠開發人員手動編寫演算法。Drago 認為這種「折中」的做法遲早是會被機器學習代替的。

根據 Waymo 官方披露的數據,Waymo 目前已經累積了約 1500 萬英里的行駛里程。按照平均每 3000 萬英里才會出現一起事故的概率來計算的話,Waymo 可能到現在都沒有得到一個特定的「長尾」案例。假設行駛每 100 萬英里會發生一起事故,waymo 也不過積累了 15 個數據而已。按照普通機器學習神經網路需要的數據量(每個圖像分類需要至少 1000 個樣本)的標準來看,Waymo 似乎還差得有些遠。儘管 Drago Anguelov 表示希望通過採集儘可能多的人類駕駛行為(包括「長尾」案例)來進行模仿學習,但「數據量的缺失」是個很大的問題。

而為了彌補這方面的缺陷,Waymo 已經構建出了一套模擬模型,模擬出儘可能多的場景來進行測試。因為有時會得出截然相反的結果,所以要加強系統的魯棒性,做出足夠多的模擬模型,確保系統的準確性。

(模擬測試是自動駕駛研發中的關鍵一環)

不過模擬模型的建立依然需要真實世界數據的支持,解決「長尾」問題也需要對人類駕駛行為進行大量地模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級「數據」的支持。

對比之下,似乎「差生」特斯拉在「數據」問題上還真是不發愁。特斯拉目前預計有超過 40 萬輛搭載了 Autopilot 系統的車子在道路上行駛,單日行駛里程超過了 1300 萬英里。如果未來這個車隊的規模增加至超過 100 萬輛,那麼每月產生的有效行駛里程將到達 10 億英里的量級。對一家已經有成熟產品落地的車企而言,這種真實世界產生的「數據」根本不是問題。

(特斯拉 Model 3)

至於特斯拉在自動駕駛研發上的獨特性,根據外媒 The Information 曾經透露的信息,特斯拉同樣在利用「里程累積」上的優勢進行模仿學習。原文(https://0x9.me/yRgBO)是這麼說的:

據熟悉特斯拉這套系統的線人爆料稱,特斯拉的車子在行駛過程中會將攝像頭及其他感測器的數據搜集起來,Autopilot 是否運行並沒有關係。之後工程師可以將這些數據中人類的駕駛行為與不同的場景進行匹配,之後遇到類似的場景機器就可以模仿人類去執行。比如怎樣拐彎或躲避障礙物。當然這種被叫做「行為克隆」的方法也有局限性,但特斯拉的工程師認為只要有足夠的數據支撐,神經網路就能夠給出正確的決策結果,例如在絕大多數場景中如何轉向、剎車以及加速。在特斯拉看來,未來不再需要人類手動編程式控制制無人車應對特定場景。不過按照個人的理解,特斯拉軟體工程師提到的「行為克隆」和 Waymo 的「模仿學習」是一個意思,等同於大家都在講的「端到端學習」的方案,即使用一個巨大的神經網路,輸入感測器數據後得到關於轉向、加速和剎車的整體執行策略。假設特斯拉採用的是端到端學習方案,那它肯定是不需要對圖像進行標記的。唯一需要「標記」的是人類駕駛員的行為,比如轉向角是多少、加減速的力度等。將整個感測器數據輸入到一個巨大的神經網路後,系統會學習如何將感測器數據與人類駕駛員的行為進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發考慮,它採用的就不大可能是和 Waymo 一樣的「端到端學習」的策略。

(「端到端」與「語義抽象」的差異)

針對自動駕駛感知的演算法差異,Mobileye 創始人 Amnon Shashua 曾經對「端到端學習 (End-to-End Learning)」和「語義抽象(Semantic Abstraction)」這兩個概念做過詳細的講解。

(Mobileye 創始人 Amnon Shashua 對自動駕駛感知的內容進行了講解)而根據外媒 The Information 報道的內容來推斷,特斯拉可能是在開發一套用於路徑規劃或執行控制的神經網路。而用來訓練這套神經網路的數據並非來自感測器,而是由感知神經網路輸出的元數據。這樣人類駕駛員的直接行為—轉向、加速和剎車可以對元數據進行「標記」,類似端到端學習中,駕駛行為與感測器數據的匹配。

這種將感知層和執行層神經網路分開的做法能夠規避 Shashua 教授上面提到的端到端學習可能產生的一系列問題:如「不常見場景」出現的幾率會大幅下降;對先備知識(Prior Knowledge)的要求提高,深度神經網路在解決一些簡單問題上可能會「慘敗」。

(「端到端」機器學習的局限性)

假設特斯拉用於訓練的數據來自特斯拉車主,通過人工的方式將一些「壞的」行為去掉,這樣可以避開人工編碼演算法的局限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監督學習來進一步優化。可以把路徑規劃或執行控制的神經網路放在運行 Autopilot 或其他駕駛輔助功能的車子上,一旦出現系統脫離、失效、碰撞等情況,工程師就可以通過 bug 報告來定位原因。這些「錯誤」之後還可以用來訓練新的神經網路。

如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規劃和執行控制方面的問題。考慮到目前搭載硬體 2.0 版本的特斯拉車型每個月可以獲得近 10 億英里的行駛里程,獲得的數據量之大是 Waymo 無法企及的。之後硬體 3.0 版本上線後,搭載了 AI 晶元的這套系統會更有利於特斯拉演算法的迭代。

一場馬拉松式的長跑

儘管Waymo深受「數據」的困擾,但光憑對這個維度的考量自然是沒辦法斷言什麼的。只不過Waymo要解決自動駕駛中的「長尾」問題,自然需要更多的數據支持。Waymo近日宣布將在亞利桑那州的梅薩市開設新的技術服務中心,進一步擴大無人車出行服務的規模。顯然Waymo是奔著搜集更多「數據」的目的來的。

(基於克萊斯勒 Pacifica 車型打造的 Waymo 自動駕駛原型車)

也有人認為,Waymo可以效仿特斯拉開發一套類似Autopilot的駕駛輔助系統,僅使用成本低廉可量產的感測器。一旦在市場鋪開後,搜集真實場景的駕駛數據也就不是什麼難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領域的合作夥伴。

上周有消息稱,「Waymo正在尋求外部投資人」。意料之中的計劃。如果有車企成為Waymo的股東,要獲得海量的駕駛數據自然容易得多。而且Waymo作為自動駕駛解決方案的供應商,始終只有藉助OEM的平台才能最終獲得商業化成功。不管是手中的全棧自動駕駛技術亦或是正在進行的移動出行業務,Waymo對很多車企而言,都是有十足吸引力的合作夥伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。對特斯拉而言,之前因為Model 3陷入「量產地獄」,Autopilot的研發進程似乎出現了停滯,硬體3.0也遲遲沒有發布。儘管在「數據」容量上有先天優勢,但率先量產以及頻發的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。

(特斯拉創始人 Elon Musk 首次發布 Autopilot 系統)

不過我個人倒是蠻欣賞之前馬斯克說過的一段話。

他說,「我不認為哪家企業能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何車企都不是我們的競爭對手」。希望這種「目中無人」的狂妄自大,可以給特斯拉帶來點好運氣。

作者 於本一

責任編輯 卧蟲圖片來源 視覺中國、特斯拉官方、演講視頻截圖

Tesla 最終勝出


未來,自動駕駛技術的壁壘,很大程度上取決於「終端」數量,每一台賣出去的「智能汽車」,都是一個駕駛數據收集器,在你人工駕駛的情況下,自動駕駛系統在不斷做出虛擬的駕駛判斷:往左還是往右、加速還是減速……

然後,把AI做出的駕駛判斷與司機人工做出的駕駛判斷進行比對,兩套數據集進行深度學習訓練,這樣,隨著智能汽車行駛里程長、人類司機數量、賣出去的終端數量的增長,積累的配對的人工與AI駕駛數據集會越來越龐大,誰掌握了越龐大的數據,誰的自動駕駛體驗就會更好。

由於不同國家的人駕駛習慣不一樣,所以,AI系統也要針對本地司機的駕駛習慣進行數據收集和深度學習訓練,最後每一個國家的AI自動駕駛系統都是本地化的版本,比如,中國司機喜歡加塞,AI自動駕駛系統必須適應這一點……

據說特斯拉的自動駕駛,無法應付中國司機從右側超車這種違反交通規則的行為……本地化很重要……最後,特斯拉應該競爭不過本土智能汽車公司,它的核心AI系統研發在美國,必然受局限。

所以,智能汽車行業,在相當長的時間內不應該盈利,而應該以略高於成本的價格大量鋪貨,增加終端數量和積累AI+人工配對駕駛里程,最終靠自動駕駛系統的綜合能力形成行業壁壘和護城河,最終,可能也會出現互聯網行業的贏家通吃現象,市場集中度會遠高於目前的燃油車市場,因為自動駕駛本質上是一個軟體問題……

而google、百度這類互聯網公司,由於不直接擁有自己的汽車廠和駕駛用戶,無法做到實時收集各種路況、各個國家地區、不同年齡駕駛員豐富的駕駛習慣數據,數據量級會被車廠遠遠甩在後面,google的駕駛數據,大部分是研發人員在特定路況下自己跑出來的,依據這樣有局限的數據,難以研發出適應各個國家駕駛習慣、路況的L4級別的自動駕駛系統。


Waymo(Google)是一家偉大的公司,Tesla是一家追求極致的公司。

我很少用 偉大 來形容一個企業。

企業文化很重要。

人類的安全是無人駕駛上路的首要考慮因素。


waymo沒了解過,坐過親戚的特斯拉,系統的用戶體驗和一些人性化設計真的沒得說……


兩家公司的方向是不太一樣的。

Waymo主要做操作系統。它目前的測試車輛都是把操作系統、感測器裝在菲亞特的車上進行測試。這一點類似於百度,自己不造車,專註於跨硬體的系統實現。

特斯拉不僅做操作系統,還要造車。這個系統應該不會授權給其他廠商使用。

他們的關係類似於Android系統和iPhone。

在技術上,兩者不會差距太大。Waymo有實際數據給大家分析,特斯拉的具體數據沒人知道,但有著大量的真實用戶在使用Autopilot。Waymo誕生之初就是為了自動駕駛,目標是L4-L5的自動駕駛等級,2018年Autopilot2能不能達到L4級自動駕駛還是個未知數。但兩者都計劃在2020年左右實現全自動駕駛。

這是來自加州路管局的Waymo自動駕駛2017年測試報告:Waymo自動駕駛測試報告

Waymo在2017年總共行駛里程352544.6英里,手工干預次數63次,平均每英里1.78次。 這個效果是所有提交到加州路管局地測試報告中最好的數據。

Tesla自動駕駛測試報告:特斯拉自動駕駛測試報告

很抱歉,特斯拉在報告中說自己並沒有在公共道路上進行過加州法律定義的自動駕駛測試,而是使用了數十億英里的來自真實用戶的數據。最後還很自豪地補了一句:"Through all of this data, we are able to develop our self-driving system more efficiently than only by accumulating data from a limited number of autonomous vehicles tested in limited locations."。但是具體是個什麼水平沒有任何數據。

在業務發展上,自動駕駛不是谷歌的核心業務,Waymo不一定能受到谷歌十分投入的支持,說不定哪天就取消項目或者賣出去了。目前谷歌爸爸還是很投入的。

而特斯拉除了電池技術,還必須要用另外一個技術把其他車廠甩開,那就是自動駕駛了,可以說能不能搞出來全自動駕駛涉及到特斯拉的生存。

最有可能的結果是Tesla最終實現全自動駕駛,做到在汽車領域的從硬體、能源到軟體的垂直整合。Waymo做出來跨硬體的通用自動駕駛系統,提供給沒有能力研發自己自動駕駛系統的汽車廠商。通用、寶馬、賓士等使用自己的無人駕駛操作系統。

加州路管局自動駕駛測試報告:Autonomous Vehicle Disengagement Reports 2017

另外貼一個通用自動駕駛報告:通用2017年自動駕駛測試報告

通用在2017年進行測試地里程是 131675.94 英里,人為干預105次。看數據似乎比Waymo要差,但是——通用在報告中說了:"Last year we drove over 125,000 miles on San Francisco』s complex city streets. ....." 意思是「哥是在最複雜最接近真實環境的路況下測試的,所以數據看起來稍差,並且由於數據更真實,我們的系統進步得更快」。


看一個東西靠不靠譜,就看實際落地情況,網上吹得再響,沒法落地一切都是白給。Waymo系當然是waymo吹得最響,各種名譽戴頭上。但是你去youtube看看,搜索下waymo的視頻,有多少個是實際乘車人錄製的視頻?少得可憐。最近waymo說要把安全員撤了,我還特地去搜索了下youtube有沒有無安全員的視頻,一個親錄視頻都沒有。相比特斯拉不顧聲譽拿人命拚命測試,waymo就像個象牙塔產品。PS:在ytb上,autopilot有20w視頻,waymo有2w,10倍差距。


問這種問題感覺樓主對這方面沒什麼了解。先自己看看再問吧。為了結論,我就甩一張圖來給樓主看看waymo到底甩了tesla幾百條街。


不論是軟體發展歷史,還是硬體發展歷史,產品的可靠性比產品的功能更加重要,更何況是與人類生活息息相關的龐然大物:汽車。特斯拉算是新型汽車企業的代表。四個輪子+方向盤,看上去那麼簡單,但是依然出了很多故障(不包括autopilot)。說明造車並不容易。而新功能的引入需要長期的可靠性驗證。深度學習理論都還沒有特別明確。更別說拿深度學慣用於汽車級的應用了。從長期來看,Google會贏,但是短期來說,特斯拉會更勝一籌。這個短期可能是10年。


推薦閱讀:
相关文章