一、MapReduce是什麼
- MapReduce是一種分散式計算框架 ,以一種可靠的,具有容錯能力的方式並行地處理上TB級別的海量數據集。主要用於搜索領域,解決海量數據的計算問題。
- MR有兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,即可實現分散式計算。
二、MapReduce做什麼
- MapReduce框架由Map和Reduce組成。
- Map()負責把一個大的block塊進行切片並計算。
- Reduce() 負責把Map()切片的數據進行匯總、計算。
三、MapReduce怎麼做