第1题:
A、map
B、sort
C、shuffle
D、reduce
第2题:
A.Job和JobControl类可以管理非线性作业之间的依赖
B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成
C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象
D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高
第3题:
A.4
B.3
C.2
D.1
第4题:
MapReduce更适合以下哪种大数据处理业务
第5题:
MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()
第6题:
A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用
第7题:
在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。
A.数据采集
B.数据管理
C.数据存储
D.数据分析与挖掘
第8题:
此题为判断题(对,错)。
第9题:
etl处理完成的数据可以存在以下哪些组件中()
第10题:
MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。