就是為什麼計算機能運行我們編寫的代碼(比如c語言,計算機為什麼會運行這個東西,原理是什麼)? 就目前我的理解,我們編輯的c語言最終載入到計算機的是二進位的數據,然後cpu 根據這些數據去進行相關的運算,那cpu 是為什麼能看懂這些二級制的數呢? 還有就是我們編寫c語言的時候,不是有全局變數,局部變數之類的嗎? 那這些到最後也是二進位的數字,這寫變數的入棧出棧,對於cpu而言,是講這些 變數放入 硬體的堆棧嗎?


又是讀個大學就能懂系列的。

行吧,老規矩,盡量簡單的語言來解釋一下。

先說一下半導體,啥叫半導體?就是介於導體和絕緣體中間的一種東西,比如二極體。

電流可以從A端流向C端,但反過來則不行。你可以把它理解成一種防止電流逆流的東西。

當C端10V,A端0V,二極體可以視為斷開。

當C端0V,A端10V,二極體可以視為導線,結果就是A端的電流源源不斷的流向C端,導致最後的結果就是A端=C端=10V

等等,不是說好的C端0V,A端10V麼?咋就變成結果是A端=C端=10V了?你可以把這個理解成初始狀態,當最後穩定下來之後就會變成A端=C端=10V。

文科的童鞋們對不住了,實在不懂問高中物理老師吧。反正你不能理解的話就記住這種情況下它相當於導線就行了。


利用半導體的這個特性,我們可以製作一些有趣的電路,比如【與門】

此時A端B端只要有一個是0V,那Y端就會和0V地方直接導通,導致Y端也變成0V。只有AB兩端都是10V,Y和AB之間才沒有電流流動,Y端也纔是10V。

我們把這個裝置成為【與門】,把有電壓的地方計為1,0電壓的地方計為0。至於具體幾V電壓,那不重要。

也就是AB必須同時輸入1,輸出端Y纔是1;AB有一個是0,輸出端Y就是0。

其他還有【或門】【非門】和【異或門】,跟這個都差不多,或門就是輸入有一個是1輸出就是1,輸入00則輸入0。

非門也好理解,就是輸入1輸出0,輸入0輸出1。

異或門難理解一些,不過也就那麼回事,輸入01或者10則輸出1,輸入00或者11則輸出0。(即輸入兩個一樣的值則輸出0,輸入兩個不一樣的值則輸出1)。

這幾種門都可以用二極體或者三極體做出來,具體怎麼做就不演示了,有興趣的童鞋可以自己試試。當然實際並不是用二極體三極體做的,因為它們太費電了。實際是用場效應管(也叫MOS管)做的。


然後我們就可以用門電路來做CPU了。當然做CPU還是挺難的,我們先從簡單的開始:加法器。

加法器顧名思義,就是一種用來算加法的電路,最簡單的就是下面這種。

AB只能輸入0或者1,也就是這個加法器能算0+0,1+0或者1+1。

輸出端S是結果,而C則代表是不是發生進位了,二進位1+1=10嘛。這個時候C=1,S=0

費了大半天的力氣,算個1+1是不是特別有成就感?

那再進一步算個1+2吧(二進位01+10),然後我們就發現了一個新的問題:第二位需要處理第一位有可能進位的問題,所以我們還得設計一個全加法器。

每次都這麼畫實在太麻煩了,我們簡化一下

也就是有3個輸入2個輸出,分別輸入要相加的兩個數和上一位的進位,然後輸入結果和是否進位。

然後我們把這個全加法器串起來

我們就有了一個4位加法器,可以計算4位數的加法也就是15+15,已經達到了幼兒園中班水平,是不是特別給力?


做完加法器我們再做個乘法器吧,當然乘任意10進位數是有點麻煩的,我們先做個乘2的吧。

乘2就很簡單了,對於一個2進位數數我們在後面加個0就算是乘2了

比如
5=101(2)
10=1010(2)

所以我們只要把輸入都往前移動一位,再在最低位上補個零就算是乘2了。具體邏輯電路圖我就不畫,你們知道咋回事就行了。

那乘3呢?簡單,先位移一次(乘2)再加一次。乘5呢?先位移兩次(乘4)再加一次。

所以一般簡單的CPU是沒有乘法的,而乘法則是通過位移和加算的組合來通過軟體來實現的。這說的有點遠了,我們還是繼續做CPU吧。

現在假設你有8位加法器了,也有一個位移1位的模塊了。串起來你就能算

(A+B)X2

了!激動人心,已經差不多到了準小學生水平。

那我要是想算

AX2+B

呢?簡單,你把加法器模塊和位移模塊的接線改一下就行了,改成輸入A先過位移模塊,再進加法器就可以了。

啥????你說啥???你的意思是我改個程序還得重新接線?

所以你以為呢?編程就是把線來回插啊。

驚喜不驚喜?意外不意外?

早期的計算機就是這樣編程的,幾分鐘就算完了但插線好幾天。而且插線是個細緻且需要耐心的工作,所以那個時候的程序員都是清一色的漂亮女孩子,穿制服的那種,就像照片上這樣。是不是有種生不逢時的感覺?


雖然和美女作伴是個快樂的事,但插線也是個累死人的工作。所以我們需要改進一下,讓CPU可以根據指令來相加或者乘2。

這裡再引入兩個模塊,一個叫flip-flop,簡稱FF,中文好像叫觸發器。

這個模塊的作用是存儲1bit數據。比如上面這個RS型的FF,R是Reset,輸入1則清零。S是Set,輸入1則保存1。RS都輸入0的時候,會一直輸出剛才保存的內容。

我們用FF來保存計算的中間數據(也可以是中間狀態或者別的什麼),1bit肯定是不夠的,不過我們可以並聯嘛,用4個或者8個來保存4位或者8位數據。這種我們稱之為寄存器(Register)。

另外一個叫MUX,中文叫選擇器。

這個就簡單了,sel輸入0則輸出i0的數據,i0是什麼就輸出什麼,01皆可。同理sel如果輸入1則輸出i1的數據。當然選擇器可以做的很長,比如這種四進一出的

具體原理不細說了,其實看看邏輯圖琢磨一下就懂了,知道有這個東西就行了。

有這個東西我們就可以給加法器和乘2模塊(位移)設計一個激活針腳。

這個激活針腳輸入1則激活這個模塊,輸入0則不激活。這樣我們就可以控制數據是流入加法器還是位移模塊了。


於是我們給CPU先設計8個輸入針腳,4位指令,4位數據。

我們再設計3個指令:

0100,數據讀入寄存器

0001,數據與寄存器相加,結果保存到寄存器

0010,寄存器數據向左位移一位(乘2)

為什麼這麼設計呢,剛才也說了,我們可以為每個模塊設計一個激活針腳。然後我們可以分別用指令輸入的第二第三第四個針腳連接寄存器,加法器和位移器的激活針腳。

這樣我們輸入0100這個指令的時候,寄存器輸入被激活,其他模塊都是0沒有激活,數據就存入寄存器了。同理,如果我們輸入0001這個指令,則加法器開始工作,我們就可以執行相加這個操作了。

這裡就可以簡單回答這個問題的第一個小問題了:

那cpu 是為什麼能看懂這些二級制的數呢?

為什麼CPU能看懂,因為CPU裡面的線就是這麼接的唄。你輸入一個二進位數,就像開關一樣激活CPU裡面若干個指定的模塊以及改變這些模塊的連同方式,最終得出結果。

幾個可能會被問道的問題

Q:CPU裡面可能有成千上萬個小模塊,一個32位/64位的指令能控制那麼多嗎?

A:我們舉例子的CPU裡面只有3個模塊,就直接接了。真正的CPU裏會有一個解碼器(decoder),把指令翻譯成需要的形式。

Q:你舉例子的簡單CPU,如果我輸入指令0011會怎麼樣?

A:當然是同時激活了加法器和位移器從而產生不可預料的後果,簡單的說因為你使用了沒有設計的指令,所以後果自負唄。(在真正的CPU上這麼幹大概率就是崩潰唄,當然肯定會有各種保護性的設計,死也就死當前進程)


細心的小夥伴可能發現一個問題:你設計的指令

【0001,數據與寄存器相加,結果保存到寄存器】

這個一步做不出來吧?畢竟還有一個回寫的過程,實際上確實是這樣。我們設計的簡易CPU執行一個指令差不多得三步,讀取指令,執行指令,寫寄存器。

經典的RISC設計則是分5步:讀取指令(IF),解碼指令(ID),執行指令(EX),內存操作(MEM),寫寄存器(WB)。我們平常用的x86的CPU有的指令可能要分將近20個步驟。

你可以理解有這麼一個開關,我們啪的按一下,CPU就走一步,你按的越快CPU就走的越快。咦?聽說你有個想法?少年,你這個想法很危險啊,姑且不說你有沒有麒麟臂,能不能按那麼快(現代的CPU也就2GHz多,大概也就一秒按個20億下左右吧)

就算你能按那麼快,雖然速度是上去了,但功耗會大大增加,發熱上升穩定性下降。江湖上確實有這種玩法,名曰超頻,不過新手不推薦你嘗試哈。

那CPU怎麼知道自己走到哪一步了呢?前面不是介紹了FF麼,這個不光可以用來存中間數據,也可以用來存中間狀態,也就是走到哪了。

具體的設計涉及到FSM(finite-state machine),也就是有限狀態機理論,以及怎麼用FF實裝。這個也是很重要的一塊,考試必考哈,只不過跟題目關係不大,這裡就不展開講了。


我們再繼續剛才的講,現在我們有3個指令了。我們來試試算個(1+4)X2+3吧。

0100 0001 ;寄存器存入1
0001 0100 ;寄存器的數字加4
0010 0000 ;乘2
0001 0011 ;再加三

太棒了,靠這臺計算機我們應該可以打敗所有的幼兒園小朋友,稱霸大班了。而且現在我們用的是4位的,如果換成8位的CPU完全可以吊打低年級小學生了!

實際上用程序控制CPU是個挺高級的想法,再此之前計算機(器)的CPU都是單獨設計的。

1969年一家日本公司BUSICOM想搞程式控制的計算器,而負責設計CPU的美國公司也覺得每次都重新設計CPU是個挺傻X的事,於是雙方一拍即合,於1970年推出一種劃時代的產品,世界上第一款微處理器4004。

這個架構改變了世界,那家負責設計CPU的美國公司也一步一步成為了業界巨頭。哦對了,它叫Intel,對,就是噔噔噔噔的那個。


我們把剛才的程序整理一下,

01000001000101000010000000010011

你來把它輸入CPU,我去準備一下去幼兒園大班踢館的工作。

神馬?等我們輸完了人家小朋友掰手指都能算出來了??

沒辦法機器語言就是這麼反人類。哦,忘記說了,這種只有01組成的語言被稱之為機器語言(機器碼),是CPU唯一可以理解的語言。不過你把機器語言讓人讀,絕對一秒變典韋,這誰也受不了。

所以我們還是改進一下吧。不過話雖這麼講,也就往前個30年,直接輸入01也是個挺普遍的事情。

於是我們把我們機器語言寫成的程序

0100 0001 ;寄存器存入1
0001 0100 ;寄存器的數字加4
0010 0000 ;乘2
0001 0011 ;再加三

改寫成

MOV 1 ;寄存器存入1
ADD 4 ;寄存器的數字加4
SHL 0 ;乘2(介於我們設計的乘法器暫時只能乘2,這個0是佔位的)
ADD 3 ;再加三

是不是容易讀多了?這就叫彙編語言。

彙編語言的好處在於它和機器語言一一對應。

也就是我們寫的彙編可以完美的改寫成機器語言,直接指揮cpu,進行底層開發;我們也可以把內存中的數據dump出來,以彙編語言的形式展示出來,方便調試和debug。


彙編語言極大的增強了機器語言的可讀性和開發效率,但對於人類來說也依然是太晦澀了,於是我們又發明瞭高級語言,以近似於人類的語法來表現數據結構和演算法。

比如很多語言都可以這麼寫:

a=(1+4)*2+3;

當然這樣計算機是不認識的,我們要把它翻譯成計算機認識的形式,這個過程叫編譯,用來做這個事的東西叫編譯器。

具體怎麼把高級語言弄成彙編語言/機器語言的,一本書都寫不完,我們就舉個簡單的例子。

我們把

(1+4)*2+3

轉換成

1,4,+,2,*,3,+

這種寫法叫後綴表示法,也成為逆波蘭表示法。相對的,我們平常用的表示法叫中綴表示法,也就是符號方中間,比如1+4。而後綴表示法則寫成1,4,+。

轉換成這種寫法的好處是沒有先乘除後加減的影響,也沒有括弧了,直接算就行了。

具體怎麼轉換的可以找本講編譯原理的書看看,這裡不展開講了。

轉換成這種形式之後我們就可以把它改成成彙編語言了。

從頭開始處理,最開始是1,一個數字,那就存入寄存器。

MOV 1

之後是4,+,那就加一下

ADD 4

然後是2,*,那就乘一下(介於我們設計的乘法器暫時只能乘2,這個0是佔位的)

SHL 0

最後是3,+,那再加一下

ADD 3

最後我們把翻譯好的彙編整理一下

MOV 1
ADD 4
SHL 0
ADD 3

再簡單的轉換成機器語言,就可以拿到我們設計的簡單CPU上運行了


其實到了這一步,應該把這個問題都講清楚了:C語言寫出來的東西是怎麼翻譯成二進位的,電腦又是怎麼運行這個二進位的。

只不過題主最後還提到棧和硬體的關係,這裡就再多說幾句。

其實棧是一種數據結構,跟CPU無關。只不過棧這個數據結構實在太常用了,以至於CPU會針對性的進行優化。為了能讓我們的CPU也能用棧,我們給它增加幾個組件。

第一,增加一組寄存器。現在有兩組寄存器了,我們分別成為A和B。

第二,增加兩個指令,RDA/RDB和WRA/WRB,分別為把指定內存地址的數據讀到寄存器A/B,和把寄存器A/B的內容寫到指定地址。

順便再說下內存,內存有個地址匯流排,有個數據匯流排。比如你要把1100這個數字存到0011這個地址,就把1100接到數據匯流排,0011接到地址匯流排,都準備好了啪嚓一按開關(對,就是我們前面提到的那個開關),就算是存進去了。

什麼叫DDR內存呢,就是你按這個開關的時候存進去一個數字,抬起來之前你把地址和數據都更新一下,然後一鬆手,啪!又進去一個。也就是正常的內存你按一下進去1個數據,現在你按一下進去倆數據,這就叫雙倍速率(Double Data Rate,簡稱DDR)

加了這幾個命令之後我們發現按原來的設計,CPU每個指令針腳控制一個模塊的方式的話針腳不夠用了。所以我們就需要加一個解碼器了(decoder)。

於是我們選擇用第二個位作為是否選擇寄存器的針腳。如果為0,則第三第四位可以正常激活位移器和加法器;如果為1則只激活寄存器而不激活位移和加法器,然後用第四位來決定是寄存器A還是B

這樣變成了

0100,數據讀入寄存器A

0101,數據讀入寄存器B (我們把彙編指令定義為MOVB)

0001,數據與寄存器A相加,結果保存到寄存器A

0011,數據與寄存器B相加,結果保存到寄存器B(我們把彙編指令定義為ADDB)

0010,寄存器A數據向左位移一位(乘2)

最後我們可以用第一位來控制是不是進行內存操作。如果第一位為1則也不激活位移和加法器模塊,然後用第三個針腳來控制是讀還是寫。這樣就有了

1100,把寄存器B的地址數據讀入寄存器A(我們把彙編指令定義為RD)

1110,寄存器A的數據寫到寄存器B指定的地址(我們把彙編指令定義為WR)

我們加了個解碼器之後,加法器的激活條件從

p4

變成了

(NOT (p1 OR p2)) AND p4

加法器的輸入則由第三個針腳判斷,0則為寄存器A,1為寄存器B

這就是簡單的指令解碼啦。

當然我們也可以選擇不向下兼容,另外設計一套指令。不過放到現實世界恐怕就要出大亂子了,所以你也可以想像我們平常用的x86背了個多大的歷史包袱。


這個時候我們用棧的話,先棧地址初始化

0101 1000 ; MOVB 16; 把棧底地址定義為1000

之後入棧的話,比如把數字3,4入棧

1111 0011 ; WR 03; 把3寫到內存,地址為1000
0011 0001 ; ADDB 01; 棧地址+1
1111 0100 ; WR 04; 把3寫到內存,地址為1001
0011 0001 ; ADDB 01; 棧地址+1

這樣就把3,4都保存到棧裏了。

出棧的話反過來

0011 1111 ; ADDB -1; 棧地址-1
1101 0000 ; RD 00; 把內容讀入寄存器A,00是佔位
0011 1111 ; ADDB -1; 棧地址-1
1101 0000 ; RD 00; 把內容讀入寄存器A,00是佔位

這樣就依次得到4,3兩個值。

所以,入棧出棧其實就是把數據寫道指定的內存位置,CPU其實不知道你是在幹啥。

當然我們也可以讓CPU知道。

接下來我們再改進一下,給CPU再加一個寄存器SP,並定義兩個指令:一個PUSH,一個POP。動作分別是把數據寫入SP的地址,然後SP=SP+1,POP的話反過來。

這樣有什麼好處呢?好處在於PUSH/POP這樣的指令消耗特別少,速度特別快。而棧這種數據結構在各種程序裏用的又特別頻繁,設計成專用的指令則可以很大程度上提升效率。

當然前提是編譯器知道這個指令,並且做了優化,所以同樣的程序(c語言寫的),編譯參數不一樣(打開/關閉某些特性),編譯出來的東西也就不一樣,在不同硬體上的運行的效率也就會不一樣。

比如上古時代的mmx,今天的SSE4.2,AVX-512,給力不給力?特別給力,但你平常用的程序支不支持是另一碼事,要支持怎麼辦?重新編譯唄。

這個時候開源的優勢就顯示出來了,重新編譯很方便。閉源的話你就要指望作者開恩啦。


結語:

多謝大家捧場,斷斷續續更了一週,終於算是更完了。

對於大多數人來說,電腦就是個黑箱,我們很難理解它到底是怎用工作的。這個問題又很難一句兩句解釋清楚,因為它是一環扣一環的,每一環都很抽象,每一環都是基礎值倆個學分,展開了講沒上限的那種。

這就導致了即使是系統學過計算機的人也不見得就有一個明確而清晰的思路。

所以借著這個機會,想用盡量短的篇幅和盡量簡單的語言把這個事從頭到位解釋了一下,希望能給大家解答一些疑惑。結果寫完之後發現也還是寫了長長的一篇。能讀到底的都是猛士,再次謝謝大家捧場。

最後,行文匆忙,接下來會把之前的各種小錯改一改,有什麼問題也可以在評論裏提出來哈。


謝邀。現代CPU是如何認識代碼的?這個基本的知識實際上知道的人卻十分少。其他答案都舉了加法器等等邏輯運算單元做例子,但實際上它只是CPU decode的後端的末尾部分。真正複雜的邏輯在前端和後端發射,pipeline等部分。今天我們就從最新的Icelake的微結構Sunny Cove

講起,看看指令怎麼被分解到運算單元去的。

準備工作

現代高級語言要被編譯器編譯成CPU認識的機器代碼,纔能夠被CPU所識別並執行;而彙編語言只是被發明出來方便人類解讀和產生機器代碼的,這些基本知識我就不介紹了。一組機器代碼和相應彙編語言的例子:

這些指令和數據流在被識別(decode)之前會被分別放入一級cache(L1 Cache)中,指令放在指令L1 Cache中,數據放在數據L1 Cache中。注意L1 Cache是唯一指令和數據單獨分割的Cache。然後,指令Cache中的指令會進入解碼器decode,那裡纔是神奇的開始:

微碼/微指令

現代CPU的指令解碼器(Instruction Decode Unit ,IDU)大致分成兩種:硬體指令解碼器和微碼指令解碼器。

硬體指令解碼器是完全由硬體連線(hardwired)完成的機器代碼解碼。它是最原始的解碼器,由有限狀態機驅動,解碼速度十分快。它現在還在很多精簡指令CPU(RISC)中發揮作用。

我們現在普遍使用的電腦X86 CPU,採用的是複雜指令集(CISC),指令很多,而且長短不一。如果所有的指令全部採用硬體解碼,那將是一個不可能完成的任務。所以一條機器指令,將被拆解成數個類似RISC的精簡微操作:微碼,Micro-Ops。而這些Micro-Ops,則可以完全被硬體執行。如下面這個例子:

那麼每個X86指令會被分解成多少個micro-ops呢?這和該指令的複雜程度相關,很簡單的指令甚至只有一個micro-ops,一般3個左右,複雜的可以4個以上。

這麼做除了能化繁為簡外,它的輸出Micro-Ops作為可以執行的最小單位,可以被調度入Pipeline中來提高指令的並行性

然後才會進入ALU,IMUL等等邏輯運算單元。它們基本是由邏輯門搭出來的。

其他

這麼神奇的Micro-Ops,我們是不是不會碰到它呢?實際上,很多人都聽過它並還在每次重啟都更新過它!!

是的,你沒有看錯,它的另一個名字就是Microcode,Kabylake等等CPU的Meltdown問題就是用它來修正的。微指令的解碼是從CPU中的一個ROM中得到翻譯過的微指令的:

而CPU中出了Bug等等問題,它還有一塊RAM來patch這個Rom:

既然是RAM,這就是為什麼Microcode的Patch每次重啟都要重新打上去的原因。這個Patch在指令decode這麼底層來進行幹預,所以才能修正很多有時候需要重新修改硬體才能解決的問題

後記

一條機器指令,經過重重解碼,才會流到邏輯運算單元。而這個decode的過程,讓曾經涇渭分明的RISC和CISC兩種CPU架構的界限變得模糊了起來。RISC CPU加入了越來越多的指令,很多CPU也不再僅僅是硬體指令解碼,而對部分指令採取了微碼解碼方式。而CISC CPU因為加入了Micro-Ops,而在decode後端顯示出了RISC的特性。

AMD 銳龍5 3600 處理器 (r5)7nm 6核12線程京東去購買?

英特爾(Intel)i9-9900K 酷睿八核 盒裝CPU處理器京東去購買?

歡迎大家關注我的專欄和用微信掃描下方二維碼加入微信公眾號"UEFIBlog",在那裡有最新的文章。

用微信掃描二維碼加入UEFIBlog公眾號

這個問題好複雜的,,,大學中需要學好幾門課才能完整回答這個問題。我在這大致提幾個相關的知識點,零零碎碎地也算是回答以下這個問題。(我也沒有這個能力把這個問題完整而又體系化地解釋清楚)

  1. CPU不能直接識別並運行高級語言(比如C語言)寫成的代碼。這裡的「直接」就是不依靠專門的軟體就能完成的意思。任何高級語言代碼必須經過某個複雜的軟體(編譯器、解釋器)的處理才能運行。
  2. CPU能夠直接識別的程序是由一條一條指令組成的。每一條指令都對應一個CPU的一個基本操作,這些操作實際上都很基礎,比如更改某個寄存器的值、讓兩個寄存器中的數字相加。指令在不同CPU上的結構不一樣,有時候不同CPU之間沒辦法互相識別對方的指令。但高級語言不存在這個問題,高級語言的代碼並不直接操縱CPU。
  3. 對於指令,通過純粹的電路是可以完成識別的,畢竟它在結構上比較簡單,而且也不太需要考慮上下文。不過似乎也可以將指令進一步翻譯成微指令、微程序,這一部分我還沒學完,不敢亂說,不過微指令的識別肯定是靠純電路完成的。
  4. 機器語言(CPU可以直接識別的語言)不存在「變數」這個概念,它只能操作內存和寄存器(CPU內部的幾個暫存電路,數量很有限)。變數這個概念在實現的時候通常是將之對應於某個寄存器或者某一片內存。
  5. CPU提供了一系列指令來方便程序員維護一個叫「棧」的數據結構。棧位於內存當中,棧頂和棧底都保存在特殊的寄存器當中,CPU可以隨時將數據壓棧或者出棧。這個「數據」的含義實際上比較寬泛,它可以是一個數字、字元,也可以是CPU的運行狀態。CPU可以將某一刻的運行狀態壓棧,然後跳轉到其他地方執行一段程序,然後出棧恢復之前的執行狀態,這就實現了函數的調用。沒錯,CPU也不太認識什麼叫做「函數」,不過將運行狀態壓棧以及恢復運行狀態都有專門的指令,一般就把它們成為」子程序調用指令「和「返回指令」。
  6. 對於「局部變數」,CPU連「變數」都不認識,所以局部變數什麼的也不存在了。不過這玩意可以依靠棧來實現,通過壓棧就可以隨時分配一個內存,出棧就可以認為這個內存區域不再被使用。配合剛才說過的「函數」調用的實現方法,這種依靠壓棧分配出的內存一定只能被當前正在執行的函數使用。因為函數調用前,這片內存還沒有被分配,返回後這片內存也不再使用了。


CPU是不認識程序員寫的代碼的,這需要編譯器當中間的翻譯官,在說方舟編譯器的時候說過這些,這裡更系統的說一下,會涉及到的計算機課程包括《計算機組成原理》、《電子電路》、《彙編語言》、《編譯原理》、《C/C++/JAVA 程序設計》等。

某種意義上來說算盤就是一種早期的計算機,算盤計算需要的是什麼?數據和操作,比如「1+1」這個運算「1」就是數據,「+」就是對數據進行的操作。經過這麼多年的發展,我們的電腦可以幹很多很多的事情了,但是本質上還是在做類似「1+1」的操作。

目前所接觸到的計算機都是以馮·諾依曼體系結構為主,結構如下:

簡單說就是CPU從外面取數據,然後在內部通過運算器做運算,最終將計算結果輸出,控制器則是對程序規定的控制信息進行分析,控制並協調輸入,輸出操作或內存訪問。

CPU是一顆數字電路晶元(還有模擬電路晶元),他是怎麼製造出來的呢?可以參考Intel製作的從沙子到晶元的短片,如下:

CPU上面主要是晶體管電路,晶體管只有兩個狀體:高電平和低電平,在計算機中用0(false)和1(true)表示,通過0和1能表示多少東西呢?前面我們說CPU的本質就是計算,只有兩個狀態如何計算「1+1」,「2+2」呢?有一個數學分支——布爾代數。布爾代數只有兩個數據表示:true(1)和false(0),運算符也沒有加減乘除,只有:NOT(非)、AND(與)、OR(或)(讀起來好像跟鬧太套很像)。

以AND(為例),只有兩個都為true,結果纔是true,有一個為false結果就為false,這種看似神奇的邏輯本來是證明哲學的,所以。。。

在布爾代數中,只需要通過,NOT(非)、AND(與)、OR(或)來實現運算,其實還有個常用的XOR(異或)。運算解決了,數字怎麼解決,只有0和1怎麼表示那麼多的數字?這個大家都能想到——二進位就行了,可是程序中不僅有數字還有字母呢,怎麼搞?提前編碼,就是ascii表,實際上我們輸入一個大寫字面「A」,在裡面對應的就是二進位0100 0001(十進位65);

有了布爾代數以及ascii表,計算機就可以表示所有的數字和字母(初期不支持漢字)以及符號了,下面就可以設計門電路了,CPU就是由各種門電路組成的:

到了這裡可以很容易得出一個結論,CPU用0和1就可以搞定數據和運算,CPU是搞定了,對CPU來說各種0和1的組合就是它能讀懂的「語言」,這就是我們所說的機器語言。0和1這種語言也是人來規定的,人當然也能讀懂,但是當面對非常龐大的一堆的0和1時,任誰都會崩潰,這太反人類了。

於是彙編語言誕生了,彙編語言與機器指令是一一對應的,比如我們要計算1+1,如果直接輸入機器碼會是很長的一串0和1的組合,如果是彙編語言(8086)呢?大概就是下面的樣子:

mov ax, 1 //寄存器ax送入值1,
mov bx, 1 //寄存器bx送入值1,
add ax, bx // ax和 bx 寄存器值相加

是不是很容易看懂了?寄存器又是什麼呢?是CPU內部暫時存儲指令、地址、數據的元器件,intel的64位處理器中有16個寄存器。

又說起硬體了,我們繼續說軟體,彙編語言有很多指令和助記符幫助程序員,所以這些程序編寫起來會方便很多,那CPU是如何理解彙編器的呢?其實機器也不懂彙編語言,把彙編語言轉換成都是01的機器語言需要彙編器(Assembler),其實就是彙編語言編譯器,但是這個很底層,用二進位寫的,機器可以讀懂這個翻譯。

對程序員來說,彙編語言確實比機器碼方便了,但是依然會設計寄存器,地址等,想要做一個大型軟體還是很麻煩,這就有了C語言等,後來又有了JAVA、python等高級需要,比如要用C語言寫一個"1+1",就是下面的形式:

int x;
x = 1 + 1;

是不是更簡單了,C語言一樣效率不高,因為想要更好的描述世界,進行大型程序開發面向過程的語言是力不從心的,於是就有了面向對象,有了反射等機制。不管是C語言還是JAVA、python等,都是為了方便程序員更好的抽象和描述世界,描述需求。機器依然不懂,編譯器因此誕生了,編譯器就是把程序員用的各種高級語言翻譯成處理器 才懂的機器語言。

上面我一直說的CPU都是基於Intel 的8086處理器,課本上也一直是這個,現在應該也還是,但是事實上現在已經有很多的處理器已經不是X86處理器了,ARM和X86的區別是什麼呢?ISA(An instruction set architecture , 指令集架構)不同,我們還說上面最簡單的A+B的描述,在不同的指令集上,他們的實現是不一樣的,也就是我們平時說的架構不同,所以同一個程序最後編譯到不同架構的處理器上得到的機器碼也是不同的,無法移植。

那能不能跨平臺呢?在IT界,加個中間層沒有什麼不可以的,比如JAVA就是增加了一個虛擬機,JAVA的虛擬機就是JAVA跨平臺的基礎。

先寫這麼多吧,看看有什麼疑問再補充,每一部分都是一本書,如果哪裡描述的有問題,歡迎討論指正。


簡單來說,就是C語言先轉換成彙編語言(機器碼),然後再把機器碼載入到FLASH中,接著CPU按照FLASH的指令完成相應動作。

篇幅可能比較長,涉及到從C語言到彙編,從彙編到十六進位,從十六進位到機器碼,從頭到尾來舉例說明,我們寫的程序,如C語言,是如何一步步到達CPU那裡進行執行。

這裡有幾個前提:

  • 下面做的測試,都是基於C語言。為什麼要用C語言,因為C語言是高級語言裡面最接近底層的語言,如果一上來就彙編的話可能就比較難理解了。
  • 講解用的CPU,是由比較古老的8086系列發展來的51單片機,不涉及操作系統層,方便直觀的講解從代碼到CPU的過程。
  • 51單片機就是這個東西,簡稱MCU,裡面集成了RAM,ROM,CPU等,是一個小型的計算單元。我們日常所用的很多功能性電子設備裡面的處理器都是MCU,小到一個電動牙刷,大到無人機,裡面的控制單元基本上都是MCU來完成的。
  • MCU不同於現代的CPU如Intel 9700K , AMD3600X等,MCU通常只執行單一的程序,用來完成特定的任務。比如電動牙刷上面的MCU,可以通過按按鍵開控制電機開關,控制電機的頻率等等。

89C52單片機

OK,知識鋪墊完,接下來我們就來看,C語言是如何一步步到達CPU裡面執行的。其中彙編部分可能比較晦澀難懂,但是我盡量用淺顯的語言來表述。

1、C語言

C語言是個偉大的發明,讓人們脫離了晦澀難懂的彙編時代。。。

我們先來看一段大家所熟知的C語言程序。

這裡的代碼非常簡單,就是讓變數a一直增加,一直做這樣的循環。

寫完這段代碼之後,這段代碼是不能直接執行的。那麼如何才能讓CPU讀懂並執行這些代碼呢?這裡就需要一個編譯器來進行一個轉換,把C語言轉換成機器碼。像gcc編譯器,工作就是把語言轉換成可執行的指令碼。

這裡我們用Keil IDE來對這段代碼進行編譯。編譯後會生成一個hex文件,MCU可以讀取HEX文件執行指令。為了更好的瞭解CPU讀取hex的過程,首先我們來瞭解一下彙編語言。

2、彙編語言

彙編語言是個偉大的發明,讓編程脫離了最底層的機器碼編程。。。

這裡我們來看C語言是如何轉換成彙編的。

通過編譯器,我們可以直觀的看到C語言的彙編翻譯。注意到圖片中圈出來的一行代碼:

0x000C: 02000F LJMP main(C:000F)

這行代碼,對應的就是C語言裡面的main函數。LJMP是51單片機的彙編指令,意思是 Long jump,我們暫且不管CPU是怎麼認識LJMP的,下面會詳細講。我們現在只需要知道,這句話就是告訴CPU,你該去往main裡面幹活了。

那麼main在哪裡呢?注意看代碼的最後,後面有個括弧,裡面是(C:000F)這個000F是什麼意思?會不會跟這個代碼有關?

注意看這行代碼的開頭,是0x000C,0x代表是十六進位,000C是什麼呢?跟000F似乎很像,會不會有什麼聯繫?為什麼main後面會有會有000F呢?

我們接著往下看,他又出現了!

事情似乎簡單了起來,原來如此,這裡的000F和下文是相呼應的。是的,在彙編裡面,LJMP代表的是長轉移,後面緊跟一個16bit的地址,CPU讀取到這條指令後,就會控制PC(program counter)程序指針,尋找這個16bit的地址。然後從這個地址開始執行代碼。

???PC指針是什麼?這個暫且先不管,你可以理解PC是CPU的情報員,而CPU是司令官,PC從情報局去取情報給司令員看,然後司令員根據情報指令來執行任務。而這裡的情報局,就是ROM啦。0x000F是ROM的地址,你可以理解為情報局的不同取貨號。這裡看不懂也沒關係下面還會講,我們繼續往下看。

現在我們似乎知道了C語言和彙編是有某種對應關係的,我們繼續往下看彙編代碼。

在C語言裡面,我們初始化了一個int類型的變數a,並且把a給賦值位為0了。我們來看對應的彙編代碼。

C:0x000F E4 CLR A
C:0x0010 FF MOV R7,A
C:0x0011 FE MOV R6,A

暫且不管前面的地址0x000F 和後面的 F4是什麼,我們只看彙編指令。

首先是CLR A,CLR(clear)和LJMP一樣,也是彙編指令,當CPU讀取到這條指令之後,就知道要把A給清零0了。A是51單片機裡面的累加器,是一個特殊的寄存器,通常作為一個中介來傳遞變數。

接下來是MOV R7,A,MOV(move)是彙編指令裡面的轉移指令,這句話等價與C語言中的R7=A,就是把A裡面的值賦值給了R7寄存器。

這個變數是個16bit的變數,而51單片機是8bit的單片機,每個寄存器只能儲存8bit的變數,所以這裡我們需要用兩個寄存器來儲存這個16bit的變數,所以可以看到後面的R6也是用來進行儲存的,這兩個寄存器一個儲存高八位,一個儲存低八位,加起來就是一個完整的16bit變數。

那麼,我們來嘗試把a的值改變一下?

這裡可以看出來,R6是用來儲存16進位的高8bit,R7用來儲存16進位的低8bit,兩個寄存器同時佔用來表示一個16進位的變數。

接下來我們來看加法操作,在C語言裡面,我們簡單的用一個a++就可以完成對a的自加,那麼在彙編裡面是怎麼實現的呢?

來看INC R7,INC(increase)是一條加法指令,可以讓R7寄存器的值+1。

CJNE(Compare Jump Not Equal)是一個比較+轉移指令。

CJNE R7,#0x00,C:0018 , 首先把R7和0x00做比較,當不相等的時候,就轉移到0x0018這個地址,於是開始運行這個指令。

而0x0018的指令,就是SJMP C:0013,SJMP(short jump)是一條跳轉指令,與LJMP相似,區別就是跳轉的地址範圍不同。當指令到這條指令的時候呢,程序就跳轉到0x0013這裡。

於是再次增加R7,重複此循環。

那麼什麼時候停止此循環呢?答案就是當R7溢出的時候,也就是R7加到了255,對應的十六進位是0xFF的時候,再加一次R7溢出,於是R7變成了0x00,CJNE指令不成立,程序繼續執行INC R6,就完成了十六進位的進位。

那麼怎麼用R6和R7表示C語言裡面的a呢?很簡單,通俗一點的話,就是

a = R6*256+R7,或者a = R6&

那麼問題來了,a一直加下去,總有加到65535(0xFFFF)的時候,那怎麼辦呢?沒辦法,你C語言裡面就沒做處理,彙編自然也不管了啊,加到頭就溢出,從0開始唄。

OK,到此為止,我們舉了個簡單的例子,分析了整個從C語言到彙編指令的轉換過程,並且這裡以一個簡單的例子來說明瞭一下C語言與彙編的對應關係,實際的操作過程中,這一步我們一般是看不到的,是編譯器自動為我們進行了轉換的。

看到這,能明白彙編語言是什麼,其實你已經明白了C語言是如何到達CPU的大致步驟,接下來就是捅破那層窗戶紙的時候了。

3:機器碼

機器碼真是個偉大的發明,能夠讓人們對CPU進行動態的規劃編程,而不用為每一個任務單獨設計一個電路。

機器碼是什麼呢?機器碼就是用來直接餵給CPU的一種指令集合。是人們約定好的一種協議,在設計CPU的時候就已經規定好了。

我們玩遊戲的時候,通常會用WASD來控制任務的前左後右四個方向的行動,OK,想想一下在你手裡右一臺電報機,並且你知道對應的WASD指令如下:

· - -

· -

· · ·

- · ·

那麼當你收到一個 · - - 指令的時候,你就知道這代表的是W,那麼就應該往前走了。

其實CPU也是一樣,當他接到的不同的機器碼的時候,他知道自己要幹嘛。如果你要問他為什麼知道,那是設計的時候就這樣設計的,比如我用0000 0000代表A寄存器+1,我用0000 0001代表R0寄存器+1,我用0000 0010指令代表LJMP等等,這都是規定好的指令,然後通過設計這樣的硬體,就是CPU了。CPU的工作就是機械化翻譯這些指令,然後根據指令控制相關的寄存器動作。

在51單片機裡面,不同彙編代碼是有不同的對應的機器碼的,他們之間有一個對應表,如下圖。

再來看,我們的彙編程序,是不是之前有個東西一直被忽視了呢?

沒錯,這裡的十六進位碼就是機器碼!比如,我們用0x0F來代表 R7寄存器+1(INC R7),用0x0E來代表R6寄存器+1,用BF來代表(CJNE),後面跟的00代表要比較的數值,再後面的01代表條件程裏要跳轉到那裡去。。。那你再來看下面這個碼錶,有沒有什麼新發現?

似乎是一種柳暗花明又一村的感覺。。。。。。

我們回到剛剛的例子,我們把CPU比喻成司令員,把寄存器(一部分是RAM的寄存器)比喻成士兵,把PC指針比喻成情報員,把程序儲存器ROM比喻成有順序的情報。

再來看這個程序

那麼整個工作流程就是,情報員(PC)去從上往下依次按照號碼取情報(ROM裡面存放的機器碼),然後遞交給司令官(CPU),司令官(CPU)一次處理一條情報0x0F(INC R7),司令員一看就明白怎麼回事,立即讓代號R7士兵(R7寄存器)的8個手指(8bit的寄存器,只能處理8bit數據)代表的數+1,然後R7士兵絕對服從,從 00010011(19)(假設的)變成了00010100(20),並且一直保持這個動作。

二進位寄存器 +1

等待士兵完成後,司令員(CPU)繼續來處理PC指針取到的下一條情報(CJNE R7,#0x00,C:0018),司令員(CPU)看了下情報BF,代號CJNE,喲,這條指令不簡單,這是要讓R7士兵的值(R7寄存器)與某個數進行比較啊,於是又看到了下面的00,喲,這原來要比較的是00啊,再繼續讓下看01,是要往下跳01個地址啊。OK,這次你們倆不相等,就跳過後面的1條指令(INC R6被調過去了),告訴情報員(PC指針),跳過下一條情報,直接看後面一條。於是情報員乖乖的跳過了下一條指令,取到了0x0018地址的指令給司令員,司令員(CPU)看到80,哦,這是要讓情報員(PC指針)再跳到別的地方取指令。跳到哪裡呢?繼續看到F9,司令員眉頭一皺,這是個補碼(最高位是1),稍微思考,OK,這個數的-5,原來是要往前跳轉5個地址,隨即命令情報員(PC指針)往前跳5個地址。情報員回到0x0018,開始往回找,數了五次之後,數到了0x0013這裡(INC R7),OK,就是他了,馬上就給司令員拿過去。。。

持續循環。。。

一直加到某一次,R7士兵的8個手指不夠用了,怎麼辦,只能溢出,於是從頭開始,變成了0x00。司令員(CPU)某頭一皺,終於相等了,馬上通知情報員,這次不用跳轉了,直接拿下一條指令就行。於是情報員拿到了0x0017地址的情報,司令員一看是0E,馬上命令R6士兵(R6寄存器)加1。。。。。。

這就是整個CPU和周圍的寄存器協調工作的流程,看懂可能需要一些基礎知識,看不懂可能就要多看幾遍了。。。

看到這,似乎已經明白了C語言到CPU的過程了。但是對於MCU來說,中間還缺少了一部分。

4.機器碼-&>FLASH

我們從把C語言-&>彙編語言-&>機器碼這個過程弄明白後,還有一個過程,就是把機器碼載入到MCU的ROM中,這個ROM如果是桌面上的CPU如intel 或者AMD的cpu的話,這個ROM可能就是CPU的緩存了。

在得到機器碼之後,我們要把機器碼轉換成一個hex文件,纔能夠下載到MCU的ROM中,而這個HEX文件記錄的就是整個代碼的機器碼,被順序的儲存在單片機的ROM中如本例,我們來看一下對應的HEX文件。

彙編語言

通過編譯,我們可以得到以上的hex文件。

HEX文件,是Intel公司提出的按地址排列的數據信息,從上面的內容可以看出來,hex文件是十六進位的字元串,大家有興趣的可以看一下這篇博客,詳細講解了hex文件的構造。

單片機HEX文件完全解讀 - Craftor - 與非博客 - 與非網?

www.eefocus.com圖標

可以看到第三行,從第9個字元開始,就是機器碼了。

通過燒錄器,可以把這些機器碼燒寫在單片機的FLASH裡面,然後CPU就可以愉快的指揮各個寄存器幹活啦!

5. 機器碼-&>數字電路

有空的話就補充一下把,這部分太難懂了,都是數字電路裡面的基礎電路,講起來也沒什麼意思。。。

關於這一部分,還可以參考另外一位高贊答主。

本文是用了一個比較古老的CPU處理器來為例講解的,並且以一個簡單的C語言例子分析了整個過程,至於題主提問到的出棧,入棧等等,需要深入的瞭解到CPU外圍的寄存器分佈,彙編層面的PUSH,POP等,較為複雜。

本回答為拋磚引玉,更深的知識需要深入的研究彙編語言以及CPU和外部的設備通信。


推薦閱讀:
相關文章