AI晶元是當前科技產業和社會關注的熱點,也是AI技術發展過程中不可逾越的關鍵環節,不管有什麼好的AI演算法,想要最終落地,就必然通過AI晶元實現。

而AI晶元備受關注,也有許多爭議,「GPU好還是TPU好」,種種斷言性的結論甚囂塵上。今天就給大家剖析三大AI晶元。

GPU

GPU(Graphics Processing Unit)就是顯卡中的處理核心,早期就是用來渲染圖形的,又稱顯示核心、視覺處理器、顯示晶元、是一種專門在個人電腦、工作站、遊戲機和一些移動設備(如平板電腦、智能手機等)上圖像運算工作的微處理器。其用途是將計算機系統所需要的顯示信息進行轉換驅動,並向顯示器提供行掃描信號,控制顯示器的正確顯示,是連接顯示器和個人電腦主板的重要元件,也是「人機對話」的重要設備之一。 

在當前的人工智慧晶元領域,GPU的應用領域不容小覷。目前,包括谷歌、Facebook、微軟等科技巨頭公司在內的人工智慧領域研究的領先者,已經在使用英偉達所提供的專門應用於該領域研究的晶元產品。GPU在「深度學習」領域發揮著巨大的作用,因為GPU可以平行處理大量瑣碎信息。深度學習所依賴的是神經系統網路——與人類大腦神經高度相似的網路——而這種網路出現的目的,就是要在高速的狀態下分析海量的數據。例如,如果你想要教會這種網路如何識別出貓的模樣,你就要給它提供無數多的貓的圖片。而GPU擅長的正是海量數據的快速處理。

TPU

TPU嘛?張量處理單元,Tensor Processing Unit,Google出品的專門用於深度學習的利器。TPU具有像GPU和CPU一樣的編程,以及一套CISC指令集。作為機器學習處理器,不僅僅支持某一種神經網路,還支持卷積神經網路、LSTM、全連接網路等多種。TPU採用低精度(8位)計算,以降低每步操作使用的晶體管數量。

雖然降低精度對於深度學習的準確度影響很小,但卻可以大幅降低功耗、加快運算速度。同時,TPU使用了脈動陣列的設計,用來優化矩陣乘法與卷積運算,減少I/O操作。此外,TPU還採用了更大的片上內存,以此減少對DRAM的訪問,從而更大程度地提升性能。

說起TPU,可能很少人知道。但是,如果說起AlphaGo和AlphaGo Zero,應該就無人不知了。是的,打敗中國圍棋棋手柯潔的AlphaGo就是基於TPU計算的。AlphaGo需要48個TPU,花幾個月時間才能打敗人類,而AlphaGoZero只需要4個TPU,花3天時間就打敗了它的哥哥AlphaGo。這個硬體神器TPU和AlphaGo Zero上了《Nature》,科研人的聖刊,膜拜一下。

Google宣稱TPU在深度學習等方面效率比當前的 GPU 或 CPU 快15~30倍(除少數例子外),性能功耗比高出約30~80 倍。

FPGA

FPGA即現場可編程門陣列,它是在PAL、GAL、CPLD等可編程器件的基礎上進一步發展的產物。作為專用集成電路(ASIC)領域中的一種半定製電路而出現的晶元,既解決了定製電路的不足,又克服了原有可編程器件門電路數有限的缺點。系統設計師可以根據需要通過可編輯的連接把FPGA內部的邏輯塊連接起來,就好像一個電路試驗板被放在了一個晶元裏。

目前,國內有許多創業企業,自動加入FPGA陣營,提供基於FPGA的解決方案。比如源於清華大學的深鑒科技,專註於深度學習處理器與編譯器技術,深鑒科技研發了一種名為「深度壓縮」的技術,它不僅可以將神經網路壓縮數十倍而不影響準確度,還可以使用「片上存儲」來存儲深度學習演算法模型,減少內存讀取,大幅度減少功耗。

推薦閱讀:

相關文章