问答题MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

题目

问答题

MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

如果没有搜索结果，请直接联系老师获取答案。

相似问题和答案

第1题：

MapReduce处理流程的三大步骚不包括()

A、map

B、sort

C、shuffle

D、reduce

参考答案B

第2题：

在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

A.Job和JobControl类可以管理非线性作业之间的依赖

B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成

C.使用ChainReducer时，每个mapper和reducer对象都有一个本地JobConf对象

D.ChainReducer.addMapper()方法中，一般对键/值对发送设置成值传递，性能好且安全性高

正确答案：D

第3题：

KNN算法用MapReduce实现,要进行几轮MapReduce()。

A.4

B.3

C.2

D.1

正确答案:C

第4题：

MapReduce更适合以下哪种大数据处理业务

A、ETL
B、迭代挖掘算法
C、图挖掘算法
D、统计

正确答案:A,D

第5题：

MapReduce是一种编程模型，用于大规模数据集的并行运算，可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项？（）

A、实时性
B、高容错性
C、易于扩展
D、易于编程

正确答案:B,C,D

第6题：

下列关于MapReduce说法不正确的是( )。

A.MapReduce是一种计算框架

B.MapReduce来源于google的学术论文

C.MapReduce程序只能用java语言编写

D.MapReduce隐藏了并行计算的细节，方便使用

正确答案：C

第7题：

在将数据源经过分析挖掘到最终获得价值的大数据处理过程中，MapReduce是在（）阶段应用分布式并行处理关键技术的常用工具。

A.数据采集

B.数据管理

C.数据存储

D.数据分析与挖掘

正确答案：B

第8题：

MapReduce和Spark都属于大数据批处理计算的产品。()

此题为判断题(对，错)。

标准答案：正确

第9题：

etl处理完成的数据可以存在以下哪些组件中（）

A、hdfs
B、hive
C、hbase
D、mapreduce

正确答案:A,B,C

第10题：

MapReduce包括（）和（）两个阶段，可以进行海量数据分割、任务分解与结果汇总，从而完成海量数据的并行处理。

A、分布
B、映射
C、分析
D、化简

正确答案:B,D

工学

问答题MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

题目

相似问题和答案

更多相关问题

相关内容