第二十三章 统计与统计数据 - 五、数据科学与大数据

题目总数:6
总分数:6
时间:不限时
第 1 题    单选题
从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程是(  )。
A.
数据分析
B.
数据挖掘
C.
数据可视化
D.
数据研究
第 2 题    单选题
下列选项中不属于大数据“4V”特性的是(  )。
A.
数据量大
B.
数据多样性
C.
价值密度高
D.
数据的产生和处理速度快
第 3 题    单选题
(   )的处理对象是非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据。
A.
信息可视化
B.
知识可视化
C.
科学可视化
D.
可视化分析
第 4 题    多选题
大数据的“4V”特性有(  )。
A.
数据量大
B.
数据多样性
C.
价值密度低
D.
数据的产生和处理速度快
E.
数据易被取得
第 5 题    多选题
数据挖掘的定义包含以下几层含义(   )。
A.
数据源必须是真实的、大量的、有噪声的
B.
发现的是用户感兴趣的知识
C.
所有发现的知识都是绝对的
D.
发现的知识是可接受、可理解、可运用的
E.
并不要求发现放之四海而皆准的知识,仅支持特定的发现问题
第 6 题    多选题
分类技术是一种监督学习,即使用已知类别的训练数据建立分类模型的方法,常用的分类技术包括(   )。
A.
基于分层的方法
B.
决策树分类法
C.
基于网格的方法
D.
贝叶斯分类法
E.
神经网络