大数据考试

大数据挖掘过程中,首先需要进行的是()A、数据清理B、数据集成C、数据剔除D、数据转换

题目

大数据挖掘过程中,首先需要进行的是()

  • A、数据清理
  • B、数据集成
  • C、数据剔除
  • D、数据转换
参考答案和解析
正确答案:A
如果没有搜索结果,请直接 联系老师 获取答案。
相似问题和答案

第1题:

列举出10大数据挖掘的算法。


答案:数据挖掘领域的十大经典算法:
C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.

第2题:

下面关于数据挖掘的描述,错误的是()。

A.数据挖掘就是从大量数据中提取或“挖掘”知识

B.数据挖掘是要提取人们事先不知道的知识

C.数据挖掘是要提取潜在有用的信息和知识

D.数据挖掘可以在少量的数据中进行


正确答案:D

第3题:

( 60 )下列关于数据挖掘的叙述中,哪一条是不正确的?

A )数据挖掘被认为是知识发现过程中的一个特定步骤

B )数据挖掘是使用专门的算法从数据中抽取有用的模式

C )关联规则的发现是数据挖掘的目标之一

D ) “ 可信度 ” 表示规则所代表的事例(元组)占全部事例(元组)的百分比


正确答案:D

第4题:

下列关于数据挖掘说法错误的是()

  • A、数据挖掘就是从数据库中提炼出有用信息的过程
  • B、数据挖掘和数据库是相同的意思
  • C、数据挖掘是对数据进行选择、处理、挖掘、分析的过程
  • D、数据挖掘是数据库的一种重要应用

正确答案:A

第5题:

在关于数据挖掘的描述,正确的是______。

A.数据挖掘可以支持人们进行决策

B.数据挖掘可以对任何数据进行

C.数据挖掘与机器学习是同一的

D.数据来源质量对数据挖掘结果的影响不大

A.

B.

C.

D.


正确答案:A
解析:数据挖掘是从大量的数据中,抽取出潜在的、有价值的信息(或知识,或模型,或规则)的过程。其挖掘的结果(模型或规则)可以辅助人们进行决策支持,因此选项A是本试题的正确答案。
  数据挖掘可以对很多类型的数据进行挖掘,包括高维、海量、异构、不完全、半结构化数据等,但不是对任何数据都可以进行挖掘的。如果对少量的数据进行挖掘,那么挖掘出来的很可能是无意义的规则,数据挖掘本身也失去了意义,故选项B的说法是不正确的。
  机器学习是计算机科学和人工智能AI发展的产物。机器学习经常归结为搜索问题,即对一个非常大的假设空间进行搜索,以确定一个最佳拟合观察到的数据和学习器己有知识的假设。数据挖掘过程中经常用到机器学习的算法,但这两者不是同一的,故选项C的说法是不正确的。
  要用数据挖掘方法挖掘数据中潜在的、有效的规则,那么数据质量是至关重要的,故选项D的说法是不正确的。

第6题:

从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?()

A.数据挖掘需要有过硬的数学功底和编程技术

B.数据挖掘更重视模型或规则的构建

C.数据挖掘是技术性的“采矿”过程,发现未知的模式和规律

D.数据挖掘侧重于实际的业务知识


正确答案:D

第7题:

在关于数据挖掘的描述中,正确的是(71)。

A.数据挖掘可以支持人们进行决策

B.数据挖掘可以对任何数据进行

C.数据挖掘与机器学习是同一的

D.数据来源质量对数据挖掘结果的影响不大


正确答案:A
解析:请参考试题27-28的分析。

第8题:

请列举数据挖掘应用常见的数据源。(或者说,我们都在什么样的数据上进行数据挖掘)()


参考答案常见的数据源包括关系数据库、数据仓库、事务数据库和高级数据库系统和信息库。其中高级数据库系统和信息库包括:空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象-关系数据库、异种数据库和遗产(legacy)数据库、文本数据库和万维网(WWW)等。

第9题:

在CRM中创建和实施一个数据挖掘应用需要以下()步骤。

  • A、输入数据
  • B、确定如何使用数据挖掘
  • C、定义数据挖掘应用的用户
  • D、定义所使用的数据并进行数据预处理
  • E、数据分析

正确答案:B,C,D

第10题:

数据挖掘技术过程中,数据预处理阶段最为重要()


正确答案:错误

更多相关问题