AI晶元0.5與2.0

我從2017年的ISSCC開始寫AI硬體相關的文章，到現在剛好兩年了。在剛剛過去的ISSCC2019上，AI晶元仍然是一個熱點，有幾個session都和AI硬體相關。同時，CGO19會議的Compilers for Machine Learning Workshop，各種ML編譯器紛紛出場。從大環境來看，第一代AI晶元軟硬體技術基本成熟，產業格局逐漸穩定，已經為規模應用做好了準備，可稱之為AI晶元0.5版本。而在ISSCC會議上，大神Yann LeCun在講演中提出了對未來AI晶元的需求[1]，開啟了我們對新的架構（AI晶元2.0）的思考。

ISSCC2019

兩年前，我在公眾號發文分析了ISSCC2017 Deep-Learning Processors Session中的7篇文章。到今天，不僅AI晶元技術取得了長足的進步，大家寫文章的熱情也越來越高，相信後面會看到各種對ISSCC2019論文進行分析的文章。所以，我就不再單獨討論具體的論文了，只談一些綜合的感受。

這次我看到論文摘要的時候，首先是還是看Session 7和14的Machine Learning部分。而我最關注的是三星的論文「An 11.5TOPS/W 1024-MAC Butterfly Structure Dual-Core Sparsity-Aware Neural Processing Unit in 8nm Flagship Mobile SoC」。大家知道，三星在手機晶元中加入NPU是相對較晚的，應該說在設計中吸收了學界和業界這幾年AI晶元研發的經驗。另外，這也是業界首次公開在規模量產晶元（旗艦手機晶元）中的NPU細節，一方面反映了「真實」和「實用」（不追求指標驚人，而是有更明確的優化目標）的結果，另一方面也標誌著整個產業對NPU設計的認識已經比較成熟。

另外一個重要看點當然是Yann LeCun教授的演講。ISSCC本來是半導體產業中的「電路（circuit）」會議，這幾年越來越多的加入架構層面的內容。這次請AI大神做Keynote就更有意思了。大神在ISSCC講演的幾天之內還做了一波PR，也有宣傳Facebook自研晶元的意思。當然，大神的演講還是非常棒的，特別是對新架構的分析。這幾天已經有很多文章介紹這個研究，我這裡只貼一下他分享的的AI硬體相關的經驗教訓以及對未來的展望。