MapReduce編程模型
Mpper/Reducer/InputFormat/Spilit/Block/Partationer/Conbiner
Map階段由一定數量的Map Task組成
Reduce階段由一定數量的Reduce Task組成
Shuffle過程
1)MapTask環形緩衝區向磁碟溢寫文件之前
2)Map節點在合併本地多個溢寫文件為一個大文件之前
1)減少MapTask輸出的數據量
2)由於MapTask會將溢寫文件寫入磁碟,所以可以減少磁碟IO
3)減少ReduceTask的網路傳輸數據量
推薦閱讀: