首先是AI Chip Landscape的最新更新。

原图可以访问:

https://basicmi.github.io/AI-Chip/?

basicmi.github.io

从开始做这个AI chip list到现在有两年多了,简单写一点观察和思考吧。

现在已经不用争论AI硬体加速的必要性了,未来基本上所有晶元都会有专门的AI加速设计,差别只是放多少面积的问题。所以我们可以看到这个列表上基本包括了所有传统的晶元厂商。

非典型晶元公司做晶元已经是比较普遍的现象,甚至越来越多的展现出优势。特斯拉自己做晶元,背后是上百万量车在路上「优化」自动驾驶演算法,晶元得以「量身定制」(多角度解析Tesla FSD自动驾驶晶元)。别人做自动驾驶晶元,如何和他竞争?Google,Amazon,Facebook,Apple,Microsoft也差不多,有应用场景的支持,足够的资金和工程能力,晶元当然更容易成功,也就是所谓「降维打击」(为云而生又生于云中的晶元给我们的启示)。传统晶元厂商和以晶元为核心产品的初创公司如何和他们竞争?这些都将是决定未来竞争格局的关键问题(也是最值钱的问题)。

Startup不断涌现,不时有大量融资的消息,但差异化也越来越难。仅仅是「采用专用架构」已经没有太高的门槛了,第一批初创公司现在比拼的是工程能力和客户能力。采用新兴技术的公司,比如存内计算,模拟计算,光计算,类脑等等的确实有差异,但落地还有更长的路要走。即便如此,每个领域也都已经挤进了多个玩家。另一个寻找差异的方向是垂直应用,但如果这类应用的技术门槛低,则所谓差异化优势也不明显; 技术门槛高的,比如自动驾驶,则需要动员大量的资源。总得来说,初创公司面临的压力会越来越大。当然,对于初创公司来说,在毕业之前什么时候压力不大呢?

「硬体好做,软体困难」是大家普遍反映的问题。晶元配套的工具链是最头疼也是现在备受关注的地方。而且,软体工具的优化基本是无止境的,单核解决了,还有多核,多晶元,多板卡的问题;NN加速解决了,还有非NN演算法的问题,异构系统的问题;再有就是软硬体联合优化的问题。这一年来,可以看到大家在Framework和Compiler上的工作越来越深入。乐观估计,一年之内针对NN的编译器技术基本可以稳定(也许能统一)。但其它问题还需要持续不断的努力。

AI硬体的Benchmark,目前工作做的最扎实的是MLPerf(刚刚发布了Inference的Benchmark),AI硬体领域北美最好的公司都有参与,可惜国内企业参与不多(后面可能给大家做比较详细的介绍,促进在国内的推广)。MLPerf目前最大的问题还是部署的工作量大,Training方面就只有几个大公司提交了结果。同时,关注度比较高的是ETH Zurich的AI-Benchmark,和传统的手机跑分类似,直接用手机应用运行的结果给晶元的AI能力评分,虽然不一定公平准确,但部署简单,目前已经覆盖了大部分Android手机晶元。

AI晶元热确实带动了「架构热」(黄金时代),二三十年前的体系结构热潮中失败的各种尝试似乎又都有重见天日的希望,也给大家的差异化尝试提供了足够的素材。不过,大家还是要慎重看待,造成当年失败的问题今天就没有了吗?

和整个AI领域一样,AI硬体从学术成果到商业行为的速度也是前所未有的。好的一面是新技术可以更快进入产品,科研人员也可能更快的获得回报,对创新有很大的促进作用。但另一方面,实现一颗晶元,需要大量的工程工作。而学术研究一般只要点的突破,这两者之间的距离比其它AI应用领域要大得多。现在很多宣传,往往是讲一点上的优势,而不提要落实为产品所需的大量的「脏活累活」。这种错误导向,既可能坑了投资人,也可能伤害了创新者。

最后,AI晶元热有明显的溢出效应,很大程度上带动了相关技术和产业的进步。具体可以看看我之前的文章「AI晶元的「冷」与「热」」。


以上只是个人一点点观察和思考,欢迎讨论,欢迎批评指正。

-- The End --

欢迎关注我的微信公众号:

StarryHeavensAbove AI晶元文章导读?

mp.weixin.qq.com
图标

题图来自网路,版权归原作者所有

本文为个人兴趣之作,仅代表本人观点,与就职单位无关


推荐阅读:
相关文章