?Abstract: 本文為學習CUDA編程的第四章的概要,主要介紹第四章研究的對象

Keywords: 全局內存,CUDA內存模型,CUDA內存管理,全局內存編程,全局內存訪問模式,全局內存數據佈局,統一內存編程,提高內存吞吐量。

本章內容

上一章我們整個一章都在研究CUDA的執行模型,必須承認執行模型中,核的配置,決定了程序執行效率,但是程序的執行效率不只由線程束,線程塊等執行結構決定,內存也嚴重的影響了性能。

舉個例子,一個老例子,但是這個例子真的非常貼切,在別的書上也看過(如果一模一樣,算我抄你):工廠生產,我們可以通過優化工廠內部流水線,工人分配,工人質量,來提高生產速度,但是如果你把工廠開到珠穆朗瑪峯頂,你的提供原料的車(我們目前關心產量不關心出貨量,所以不關心如何將成品運出)一年來一輛,那整個工廠的生產效率也是非常低的,因為工人,流水線,都在等待,等待原料進來。這就是典型的一個GPU或者CPU的效率模型。內存帶寬,速度,也是影響了吞吐量的重要因素。

本章我們將剖析核函數與全局內存的聯繫,性能影響。CUDA模型是主要研究內容,通過不同的內存訪問模式來使得內核高效運行。

更多內容參考https://face2ai.com/CUDA-F-4-0-全局內存/


推薦閱讀:
相關文章