《大話計算機》內容節選之:CUDA編排線程及進程0的創建和運行
《大話計算機》一書之所以需要在8月份纔出來,原因是本次出版社對稿件要求太過苛刻,甚至比我對書裏內容、圖片的要求還要變態,弄得我也心力憔悴。所以需要很長時間的審稿、修改過程。好事多磨,唐僧取經已經80難過去了,這是最後一難,挺過來就成佛。
下面繼續貼《大話計算機》一書的內容試看。想試看任何內容,只需要留言即可,冬瓜哥會統一登記並在後續文章中放出。本書詳細簡介和目錄詳見:《大話計算機》助推國產半導體浴火重生!
往期內容鏈接:
《大話計算機》內容節選之:fork流程及QPI內存映射
《大話計算機》內容節選之:指令系統和分支預測
《大話計算機》之:計算的本質、bio
冬瓜哥彪悍圖解Cache組關聯
冬瓜哥收集了 「大話存儲」 和 」大話計算機」 兩個公眾號中帖子下的留言如下(藍色表示往期已回答,紅色表示本期選中):
計算的本質是什麼
指令系統
我想看分支預測的章節,Intel的漏洞和這個有關
fork流程
6.5.3 中qpi 選路原理能貼嗎? 特別是8p的選路
ddr 內存初始化淺析和memory training
介紹內存和MMIO的解碼規則和內存在BIOS和OS下的佈局情況
memory map和decode這兩個概念,特別是decode
5.2.3 向編譯器描述數據的編排方式
cache組關聯
7.1.3 DMA與緩存的一致性
第一章入門部分
10.2.1.1 用戶棧和內核棧
10.9.1.2
9.5.3.3 CUDA對線程的調度方式
10.2.2.3 進程0的創建和運行
6.1.1.超線程並行
6.1.2.多核心/多CPU並行
冬瓜哥點評:
CUDA是淫威大(Nvidia)GPU的通用計算編程庫,用於向GPU分配顯存、派發任務代碼、回收結果等一系列過程的控制。GPU相比CPU而言擁有更高的並行性,可以同時運行數千個線程,而目前的CPU則只能同時運行幾十個線程。
進程0是Linux內核啟動後創建和運行的第一個進程。