台湾 || 语言: 大陆简体港澳繁體台灣正體

MapReduce原理簡介

雪花臺灣 2019-07-21 07:38

一、MapReduce是什麼

MapReduce是一種分散式計算框架，以一種可靠的，具有容錯能力的方式並行地處理上TB級別的海量數據集。主要用於搜索領域，解決海量數據的計算問題。
MR有兩個階段組成：Map和Reduce，用戶只需實現map()和reduce()兩個函數，即可實現分散式計算。

二、MapReduce做什麼

MapReduce框架由Map和Reduce組成。
Map()負責把一個大的block塊進行切片並計算。
Reduce() 負責把Map()切片的數據進行匯總、計算。

三、MapReduce怎麼做

相關文章