首先是AI Chip Landscape的最新更新。

原圖可以訪問:

https://basicmi.github.io/AI-Chip/?

basicmi.github.io

從開始做這個AI chip list到現在有兩年多了,簡單寫一點觀察和思考吧。

現在已經不用爭論AI硬體加速的必要性了,未來基本上所有晶元都會有專門的AI加速設計,差別只是放多少面積的問題。所以我們可以看到這個列表上基本包括了所有傳統的晶元廠商。

非典型晶元公司做晶元已經是比較普遍的現象,甚至越來越多的展現出優勢。特斯拉自己做晶元,背後是上百萬量車在路上「優化」自動駕駛演算法,晶元得以「量身定製」(多角度解析Tesla FSD自動駕駛晶元)。別人做自動駕駛晶元,如何和他競爭?Google,Amazon,Facebook,Apple,Microsoft也差不多,有應用場景的支持,足夠的資金和工程能力,晶元當然更容易成功,也就是所謂「降維打擊」(為雲而生又生於雲中的晶元給我們的啟示)。傳統晶元廠商和以晶元為核心產品的初創公司如何和他們競爭?這些都將是決定未來競爭格局的關鍵問題(也是最值錢的問題)。

Startup不斷湧現,不時有大量融資的消息,但差異化也越來越難。僅僅是「採用專用架構」已經沒有太高的門檻了,第一批初創公司現在比拼的是工程能力和客戶能力。採用新興技術的公司,比如存內計算,模擬計算,光計算,類腦等等的確實有差異,但落地還有更長的路要走。即便如此,每個領域也都已經擠進了多個玩家。另一個尋找差異的方向是垂直應用,但如果這類應用的技術門檻低,則所謂差異化優勢也不明顯; 技術門檻高的,比如自動駕駛,則需要動員大量的資源。總得來說,初創公司面臨的壓力會越來越大。當然,對於初創公司來說,在畢業之前什麼時候壓力不大呢?

「硬體好做,軟體困難」是大家普遍反映的問題。晶元配套的工具鏈是最頭疼也是現在備受關注的地方。而且,軟體工具的優化基本是無止境的,單核解決了,還有多核,多晶元,多板卡的問題;NN加速解決了,還有非NN演算法的問題,異構系統的問題;再有就是軟硬體聯合優化的問題。這一年來,可以看到大家在Framework和Compiler上的工作越來越深入。樂觀估計,一年之內針對NN的編譯器技術基本可以穩定(也許能統一)。但其它問題還需要持續不斷的努力。

AI硬體的Benchmark,目前工作做的最紮實的是MLPerf(剛剛發布了Inference的Benchmark),AI硬體領域北美最好的公司都有參與,可惜國內企業參與不多(後面可能給大家做比較詳細的介紹,促進在國內的推廣)。MLPerf目前最大的問題還是部署的工作量大,Training方面就只有幾個大公司提交了結果。同時,關注度比較高的是ETH Zurich的AI-Benchmark,和傳統的手機跑分類似,直接用手機應用運行的結果給晶元的AI能力評分,雖然不一定公平準確,但部署簡單,目前已經覆蓋了大部分Android手機晶元。

AI晶元熱確實帶動了「架構熱」(黃金時代),二三十年前的體系結構熱潮中失敗的各種嘗試似乎又都有重見天日的希望,也給大家的差異化嘗試提供了足夠的素材。不過,大家還是要慎重看待,造成當年失敗的問題今天就沒有了嗎?

和整個AI領域一樣,AI硬體從學術成果到商業行為的速度也是前所未有的。好的一面是新技術可以更快進入產品,科研人員也可能更快的獲得回報,對創新有很大的促進作用。但另一方面,實現一顆晶元,需要大量的工程工作。而學術研究一般只要點的突破,這兩者之間的距離比其它AI應用領域要大得多。現在很多宣傳,往往是講一點上的優勢,而不提要落實為產品所需的大量的「臟活累活」。這種錯誤導向,既可能坑了投資人,也可能傷害了創新者。

最後,AI晶元熱有明顯的溢出效應,很大程度上帶動了相關技術和產業的進步。具體可以看看我之前的文章「AI晶元的「冷」與「熱」」。


以上只是個人一點點觀察和思考,歡迎討論,歡迎批評指正。

-- The End --

歡迎關注我的微信公眾號:

StarryHeavensAbove AI晶元文章導讀?

mp.weixin.qq.com
圖標

題圖來自網路,版權歸原作者所有

本文為個人興趣之作,僅代表本人觀點,與就職單位無關


推薦閱讀:
相关文章