前一段時間花了一些時間閱讀了一下陳氏兄弟寒武紀晶元以及DianNao項目的系列工作的論文,在這幾個回答里有所總結,供大家參考: 中科院說的深度學習指令集diannaoyu到底是什麼? - 楊軍的回答

寒武紀神經網路處理器效能如何 ? - 楊軍的回答


請移步目前有多家廠家投入Deep Learning深度學習處理器研發,以當前信息預計哪家會最先投入市場? - 機器學習

之前的回答

可以先部分關注這個問題,容我慢慢搬過來在這裡寫,這是最適合回答的地方。

計算所的DianNao和DaDianNao為什麼能連續斬獲ASPLOS14和MICRO14的Best Paper? - 江城雨的回答


Y. H. Chen, T. Krishna, J. Emer and V. Sze, "14.5 Eyeriss: An energy-efficient reconfigurable accelerator for deep convolutional neural networks," 2016 IEEE International Solid-State Circuits Conference (ISSCC), San Francisco, CA, 2016, pp. 262-263.

當然有了,IBM發布的TrueNorth:I百萬神經元類人腦晶元。很明顯針對深度學習演算法特性。

郵票大小、重量只有幾克,但卻集成了54億個硅晶體管,內置了4096個內核,100萬個「神經元」、2.56億個「突觸」,能力相當於一台超級計算機,功耗卻只有65毫瓦。

http://36kr.com/p/214445.html


非請自來~

Qualcomm的NPU叫zeroth,還在某個會議上demo過跑在zeroth上的可訓練機器人。intel,ibm也有類似研究。
有,我知道有人在做硬體實現CNN,好像是FPGA,更快
vlsi/architecture for machine learning是蠻火的一個方向……做的東西個人感覺更像硬體加速……


推薦閱讀:
相关文章