蘋果的統一內存和集成顯卡與CPU共用內存有什麼區別？

蘋果新mac的M1 chip 用到了統一內存 unified memory，很好奇集成顯卡和CPU共享Main Memory不是很正常嗎，這有什麼值得宣傳的？

我也不能理解，一堆KOL都提到了UMA，但蘋果這個UMA到底有什麼獨特之處，卻沒人能說清。

蘋果重新定義一項技術也不是一回兩回了，我也希望它能做出新花樣，做出好成績，但大家千萬別看到個詞就沸騰吧……

UMA不是什麼新鮮玩意兒，Intel和AMD玩核顯這麼久了，也早就有類似的支持了。

UMA到底是什麼定義，關鍵看怎麼理解這個A。UM是unified memory沒跑了，A卻可以是Access，或者Architecture（通常是後者）。

UMA的意義不僅僅是共享主存這麼簡單。BIOS里預留顯存也算共享主存，但顯然不太適合叫UMA。

我覺得UMA主要是這幾個階段發展起來的：共享數據，共享地址，共享內存（物理）。

共享數據很簡單，OpenGL時代的persistent map，讓驅動去做同步、做數據搬運，從而給開發者營造「數據隨時可得」的假象（當然也可能的確就是隨時可得），這就已經達到共享數據的要求了。

共享地址的難度則增加了一些，其目標是為了讓你在CPU上跑的鏈表能直接在GPU等地方使用。x64時代到來使得內存地址擴充到48位，而且CPU上已經全面虛擬地址，GPU也要跟著加上地址轉換的能力。

共享物理內存則明確表明，實現了上兩者的獨顯（OpenCL的SVM就是前兩個要求）也要被排除。那就基本是核顯Only（主機的架構也可以看作是核顯）。

來看一下官網的描述：

M1 also features our unified memory architecture, or UMA. M1 unifies its high?bandwidth, low?latency memory into a single pool within a custom package. As a result, all of the technologies in the SoC can access the same data without copying it between multiple pools of memory. This dramatically improves performance and power efficiency. Video apps are snappier. Games are richer and more detailed. Image processing is lightning fast. And your entire system is more responsive.

說白了關鍵是「without copying it」，也就只是個zero copy而已。

而如果只是zero copy，那就真的是很不稀奇的了：

http://pc-internet-zone.blogspot.com/2011/08/cpu-to-gpu-data-transfers-exceed-15gbs.html?

pc-internet-zone.blogspot.com

AMD在2011年就發blog介紹zero copy的強大了，map/unmap只做邏輯上的控制權轉移。

Getting the Most from OpenCL? 1.2: How to Increase Performance by...?

software.intel.com