【CUDA 基礎】4.0 全局內存

?Abstract: 本文為學習CUDA編程的第四章的概要，主要介紹第四章研究的對象

Keywords: 全局內存，CUDA內存模型，CUDA內存管理，全局內存編程，全局內存訪問模式，全局內存數據佈局，統一內存編程，提高內存吞吐量。

本章內容

上一章我們整個一章都在研究CUDA的執行模型，必須承認執行模型中，核的配置，決定了程序執行效率，但是程序的執行效率不只由線程束，線程塊等執行結構決定，內存也嚴重的影響了性能。

舉個例子，一個老例子，但是這個例子真的非常貼切，在別的書上也看過（如果一模一樣，算我抄你）：工廠生產，我們可以通過優化工廠內部流水線，工人分配，工人質量，來提高生產速度，但是如果你把工廠開到珠穆朗瑪峯頂，你的提供原料的車（我們目前關心產量不關心出貨量，所以不關心如何將成品運出）一年來一輛，那整個工廠的生產效率也是非常低的，因為工人，流水線，都在等待，等待原料進來。這就是典型的一個GPU或者CPU的效率模型。內存帶寬，速度，也是影響了吞吐量的重要因素。

本章我們將剖析核函數與全局內存的聯繫，性能影響。CUDA模型是主要研究內容，通過不同的內存訪問模式來使得內核高效運行。

更多內容參考https://face2ai.com/CUDA-F-4-0-全局內存/