一、MapReduce是什么
- MapReduce是一种分散式计算框架 ,以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。主要用于搜索领域,解决海量数据的计算问题。
- MR有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分散式计算。
二、MapReduce做什么
- MapReduce框架由Map和Reduce组成。
- Map()负责把一个大的block块进行切片并计算。
- Reduce() 负责把Map()切片的数据进行汇总、计算。
三、MapReduce怎么做