hadoop1.x -> hadoop2.x -> yarn ->伏羲調度員->你調度系統

前言：

在hadoop 1.x中和hadoop 2.x中，mapreduce的執行流程也不一樣（完全不一樣），在hadoop1.x中 mapreduce的資源管理與分配和任務監控都是集中在 jobtracker 上，這樣會造成jobtracker的負擔非常大，而且在hadoop 1.x中沒有jobtracker的HA機制，從而會讓集群的健壯性很差

1、hadoop1.x mapreduce執行過程

簡述：client端提交job給jobtracker，jobtracker會給這個job分配資源，在tasktracker上啟動task任務，而且還要監控task任務的狀況，如果task掛了，jobtracker還得重新分配新的資源給掛了的task任務，當task執行完成後，jobtracker會為reduce任務分配資源，然後監控reduce的執行流程，最後執行完成輸出

1、客戶端（Client）：編寫mapreduce程序，配置作業，提交作業，啟動Jobclient進程。
2、Jobclient向JobTracker請求一個Job ID，也就是作業ID。
3、Jobclient拷貝計算需要的代碼等文件

Jobclient將運行作業所需要的資源文件複製到HDFS上，包括MapReduce程序打包的JAR文件、配置文件和客戶端計算所得的輸入劃分信息。這些文件都存放在JobTracker專門為該作業創建的文件夾中。文件夾名為該作業的Job ID。JAR文件默認會有10個副本.

mapred.submit.replication屬性控制；輸入劃分信息告訴了JobTracker應該為這個作業啟動多少個map任務等信息
4、JobTracker接收到作業後，放入調度隊列，等待調度

JobTracker接收到Jobclient提交的作業後，將其放在一個作業隊列里，等待作業調度器對其進行調度

5、在map task開始執行時

它的輸入數據來源於HDFS的block，當然在MapReduce概念中，map task只讀取split。Split與block的對應關係可能是多對一，默認是一對一。
讀取輸入文件內容，解析成key、value對。對輸入文件的每一行，解析成key、value對。每一個鍵值對調用一次map函數，轉換成新的key、value輸出。
map任務執行過程中溢寫執行過程：當map task的輸出結果很多時，就可能會撐爆內存，所以需要在一定條件下將緩衝區中的數據臨時寫入磁碟，然後重新利用這塊緩衝區。這個從內存往磁碟寫數據的過程被稱為Spill，中文可譯為溢寫，字面意思很直觀。這個溢寫是由單獨線程來完成，不影響往緩衝區寫map結果的線程。溢寫線程啟動時不應該阻止map的結果輸出，所以整個緩衝區有個溢寫的比例spill.percent。這個比例默認是0.8，也就是當緩衝區的數據已經達到閾值（buffer size * spill percent = 100MB * 0.8 = 80MB），溢寫線程啟動，鎖定這80MB的內存，執行溢寫過程。Map task的輸出結果還可以往剩下的20MB內存中寫，互不影響。當溢寫線程啟動後，需要對這80MB空間內的key做排序(Sort)。排序是MapReduce模型默認的行為，這裡的排序也是對序列化的位元組做的排序。此處參考另外一篇文章《MapReduce之mapOutputBuffer解析》
當map task真正完成時，內存緩衝區中的數據也全部溢寫到磁碟中形成一個溢寫文件。

最終磁碟中會至少有一個這樣的溢寫文件存在(如果map的輸出結果很少，當map執行完成時，只會產生一個溢寫文件)，因為最終的文件只有一個，所以需要將這些溢寫文件歸併到一起，這個過程就叫做Merge。Merge是怎樣的？如前面的例子，「aaa」從某個map task讀取過來時值是5，從另外一個map 讀取時值是8，因為它們有相同的key，所以得merge成group。什麼是group。對於「aaa」就是像這樣的：{「aaa」, [5, 8, 2, …]}，數組中的值就是從不同溢寫文件中讀取出來的，然後再把這些值加起來。請注意，因為merge是將多個溢寫文件合併到一個文件，所以可能也有相同的key存在，在這個過程中如果client設置過Combiner，也會使用Combiner來合併相同的key

至此，map端的所有工作都已結束：tasktarcker通知JobTracker，map任務執行完畢，並告知數據輸出路徑，JobTracker啟動reduce任務

最終生成的這個文件也存放在TaskTracker夠得著的某個本地目錄內。每個reduce task不斷地通過RPC從JobTracker那裡獲取map task是否完成的信息，如果reduce task得到通知，獲知某台TaskTracker上的map task執行完成，Shuffle的後半段過程開始啟動。簡單地說，reduce task在執行之前的工作就是不斷地拉取當前job里每個map task的最終結果，然後對從不同地方拉取過來的數據不斷地做merge，也最終形成一個文件作為reduce task的輸入文件

5、Partitioner：該主要在Shuffle過程中按照Key值將中間結果分成R份，其中每份都有一個Reduce去負責，可以通過job.setPartitionerClass()方法進行設置，默認的使用hashPartitioner類。實現getPartition函數
6、在reduce task開始執行