人工智慧的兴起有三个基本要素:演算法、数据和计算能力。随著云计算的广泛应用和深入学习成为人工智慧研究和应用的主流方式,人工智慧对计算能力的需求迅速增长。AI晶元的不断深耕是人们对计算能力的不懈追求。
目前,在摩尔定律的驱动下,CPU可以在合理的计算能力、价格、功耗和时间等方面为人工智慧提供所需的计算性能。然而,人工智慧的许多数据处理都涉及矩阵的乘法和加法,CPU的设计和优化是针对数以百计的任务进行的,因此需要用CPU来执行人工智慧演算法。它中的大量其他逻辑完全浪费了现有的AI演算法,不能使CPU达到最优的性价比。面对爆炸性的计算需求,通用晶元将变得更加不可持续。
事实上,AI晶元的研究和开发有两个不同的方向:第一,在现有的计算体系结构中增加一个特殊的加速器,即「AI加速晶元」,这是一种确定性的方法来加速一种特定的演算法或任务。以满足目标应用领域在速度、功耗、内存占用和部署成本等方面的要求。
第二,完全重新开发,创建了一种模拟人脑神经网路的新架构,即「智能晶元」。它使晶元能够使用不同的人工智慧演算法来学习和推理,处理一系列的任务,包括感知、理解、分析、决策和行动,以及适应场景变化的能力。目前,这种晶元的设计方法主要有两种:一种是基于类脑计算的神经模拟晶元,另一种是基于可重构计算的软体定义晶元。
智能晶元仍处于早期开发阶段,不适合商业应用。因此,企业采用的主要方法是在现有的计算体系结构中增加人工智慧加速器。AI加速晶元的研究与开发主要分为两个方面:一是利用现有的GPU、多核处理器、DSP、FPGA晶元进行软硬体优化;二是设计专用晶元,即ASIC。
GPU、FPGA和ASIC已经成为当前AI晶元产业的主流。其中GPU是目前市场上最成熟、应用最广泛的人工智慧计算晶元。它是一个由大量核组成的大规模并行计算体系结构,设计用于同时处理多个任务。GPU的台式机和伺服器市场主要被NVIDIA、AMD、移动市场划分为高通、苹果、联发科等多家公司。