22秋学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00003

未知 试卷 2022-11-08 283

摘要:1、[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()A、折线图B、散点图C、条形图D、饼图 2、[判断题] 多维数据指的是具有多个维度属性的数据变量。A、对B、错 3、[单选题] ()是Microsoft Office的核心组件A、SQLB、WORDC、PPTD、...

1、[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()

A、折线图

B、散点图

C、条形图

D、饼图

 2、[判断题] 多维数据指的是具有多个维度属性的数据变量。

A、对

B、错

 3、[单选题] ()是Microsoft Office的核心组件

A、SQL

B、WORD

C、PPT

D、EXCEL

 4、[判断题] 由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择

A、对

B、错

 5、[多选题] 层次方法可以分为()

A、K均值算法

B、K中心点算法

C、凝聚法

D、分裂法

 6、[单选题] DAS代表的意思是()

A、两个异步存储

B、数据归档软件

C、连接一个可选的存储

D、直连存储

 7、[单选题] 医疗健康数据的基本情况不包括以下哪项?

A、诊疗数据

B、个人健康管理数据

C、公共安全数据

D、健康档案数据

 8、[多选题] 下列正确的是()

A、D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用

B、D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行

C、D3采用的是Selectors API的第一级标准

D、基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。

 9、[单选题] 下列哪个工具常用来开发移动友好地交互地图()

A、Leaflet

B、Visual.ly

C、BPizza Pie Charts

D、Gephi

 10、[多选题] 交通数据处理包括以下几个步骤()

A、数据清洗

B、数据映射

C、数据组织

D、数据聚类

 11、[多选题] 关于R语言扩展包下列正确的是()

A、network可创建带有点和边的网络图

B、animation可制作一系列的图像并将它们串联起来做成动画

C、ggmaps通过树图来可视化层次型数据

D、protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具

 12、[判断题] 数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。

A、对

B、错

 13、[多选题] 医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()

A、多态性

B、时效性

C、不完整性

D、冗余性

 14、[单选题] 大数据的最显著特征是() 。

A、数据规模大

B、数据类型多样

C、数据处理速度快

D、数据价值密度高

 15、[判断题] Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。

A、对

B、错

 16、[判断题] 规则性分析(Prescriptive Analysis)用于解决决策制定和提高分析效率

A、对

B、错

 17、[多选题] 数据变换的常用方法有##,##,##,##

A、中心化变换

B、极差规格化变换

C、标准化变换

D、对数变换

 18、[判断题] 空间视图提供了交通堵塞的概览

A、对

B、错

 19、[单选题] 数据清洗的方法不包括

A、缺失值处理

B、噪声数据清除

C、一致性检查

D、重复数据记录处理

 20、[多选题] 大数据采集主要包括()四种。

A、系统日志采集

B、网络数据采集

C、数据库采集

D、其他数据采集

 21、[单选题] SAN是一种()

A、存储设备

B、专为数据存储而设计构建的网络

C、光纤交换机

D、HBA

 22、[判断题] 基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。

A、对

B、错

 23、[判断题] 用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。

A、对

B、错

 24、[多选题] 云计算的特点是()

A、大规模

B、高扩展性

C、虚拟化

D、按需分配

 25、[单选题] PaaS是()的简称

A、软件即服务

B、平台即服务

C、基础设施即服务

D、硬件即服务

 26、[单选题] 以下不是数据仓库基本特征的是()

A、数据仓库是面向主题的

B、数据仓库是面向事务的

C、数据仓库的数据是相对稳定的

D、数据仓库的数据是反映历史变化的

 27、[多选题] 网络数据采集常用的是通过##或##等方式从网站上获取数据信息。

A、网络爬虫

B、网站公开API

C、手动获取

 28、[多选题] 常见的分类方法有

A、决策树

B、贝叶斯网络

C、遗传算法

D、FP算法

 29、[判断题] 数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。

A、对

B、错

 30、[单选题] GFS中的文件切分成()的块进行存储

A、32MB

B、64MB

C、128MB

D、1G

 31、[多选题] 大数据在医疗中的应用有()

A、流行性疾病预防

B、慢性病健康管理

C、临床决策支持

D、医疗器械研发

 32、[单选题] 下列哪个R语言扩展包可以创建带有点和边的网络图()

A、ggplot2

B、network

C、ggmaps

D、animation

 33、[判断题] R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。

A、对

B、错

 34、[单选题] 基础设施即服务的英文简称是

A、IaaS

B、PaaS

C、SaaS

 35、[判断题] 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。

A、对

B、错

 36、[多选题] 常见的非结构化数据有()

A、web网页

B、即时消息

C、富文本文档

D、实时多媒体数据

 37、[判断题] 数据流要表现出流数据的特征,反映的是系统中流动的数据;

A、对

B、错

 38、[多选题] 数据处理的两种方法是##,##

A、批处理

B、流处理

C、单个处理

D、交叉处理

 39、[单选题] 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()

A、ggplot2

B、network

C、ggmaps

D、animation

 40、[多选题] 数据归约(Data Reduction)主要有()

A、维度规约

B、样本规约

C、数据聚集

D、离散化概念分层

 41、[多选题] 大数据在教育中的应用

A、网上公开课

B、慕课

C、智慧校园

D、翻转课堂

 42、[单选题] 大数据的特点不包含

A、数据体量大

B、价值密度高

C、处理速度快

D、数据不统一

 
相关推荐

评论列表
友情链接
关闭

用微信“扫一扫”