原創教程,轉載請聯繫作者並註明出處:https://github.com/WalkerLau
源碼地址:https://github.com/WalkerLau/Accelerating-CNN-with-FPGA
最近發現很多小夥伴都想用FPGA加速卷積神經網路運算,而恰好我剛做完的本科畢設就是這個題目,所以就有了寫這個教程的想法,希望能給還沒開始的小夥伴一點思路與幫助,更希望大神們給出一些進一步優化的建議。
最終加速性能
話不多說,先看最終的加速效果。本加速系統僅加速卷積層的運算,下圖展示了僅採用CPU和採用CPU+FPGA加速系統來處理VIPLFaceNet人臉識別演算法時,計算7個卷積層所耗費的時鐘數的對比。由圖可見,相比於4核ARM A53處理器,本加速系統最終可以對VIPLFaceNet的大部分卷積層實現45~75倍的運算加速。