工学

问答题MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

题目
问答题
MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。
如果没有搜索结果,请直接 联系老师 获取答案。
如果没有搜索结果,请直接 联系老师 获取答案。
相似问题和答案

第1题:

MapReduce处理流程的三大步骚不包括()

A、map

B、sort

C、shuffle

D、reduce


参考答案B

第2题:

在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

A.Job和JobControl类可以管理非线性作业之间的依赖

B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成

C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象

D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高


正确答案:D

第3题:

KNN算法用MapReduce实现,要进行几轮MapReduce()。

A.4

B.3

C.2

D.1


正确答案:C

第4题:

MapReduce更适合以下哪种大数据处理业务

  • A、ETL
  • B、迭代挖掘算法
  • C、图挖掘算法
  • D、统计

正确答案:A,D

第5题:

MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()

  • A、实时性
  • B、高容错性
  • C、易于扩展
  • D、易于编程

正确答案:B,C,D

第6题:

下列关于MapReduce说法不正确的是( )。

A.MapReduce是一种计算框架

B.MapReduce来源于google的学术论文

C.MapReduce程序只能用java语言编写

D.MapReduce隐藏了并行计算的细节,方便使用


正确答案:C

第7题:

在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。

A.数据采集

B.数据管理

C.数据存储

D.数据分析与挖掘


正确答案:B

第8题:

MapReduce和Spark都属于大数据批处理计算的产品。()

此题为判断题(对,错)。


标准答案:正确

第9题:

etl处理完成的数据可以存在以下哪些组件中()

  • A、hdfs
  • B、hive
  • C、hbase
  • D、mapreduce

正确答案:A,B,C

第10题:

MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。

  • A、分布
  • B、映射
  • C、分析
  • D、化简

正确答案:B,D

更多相关问题