1、[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()摘要:1、[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()A、折线图B、散点图C、条形图D、饼图 2、[判断题] 多维数据指的是具有多个维度属性的数据变量。A、对B、错 3、[单选题] ()是Microsoft Office的核心组件A、SQLB、WORDC、PPTD、...
A、折线图
B、散点图
C、条形图
D、饼图
2、[判断题] 多维数据指的是具有多个维度属性的数据变量。A、对
B、错
3、[单选题] ()是Microsoft Office的核心组件A、SQL
B、WORD
C、PPT
D、EXCEL
4、[判断题] 由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择A、对
B、错
5、[多选题] 层次方法可以分为()A、K均值算法
B、K中心点算法
C、凝聚法
D、分裂法
6、[单选题] DAS代表的意思是()A、两个异步存储
B、数据归档软件
C、连接一个可选的存储
D、直连存储
7、[单选题] 医疗健康数据的基本情况不包括以下哪项?A、诊疗数据
B、个人健康管理数据
C、公共安全数据
D、健康档案数据
8、[多选题] 下列正确的是()A、D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B、D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C、D3采用的是Selectors API的第一级标准
D、基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
9、[单选题] 下列哪个工具常用来开发移动友好地交互地图()A、Leaflet
B、Visual.ly
C、BPizza Pie Charts
D、Gephi
10、[多选题] 交通数据处理包括以下几个步骤()A、数据清洗
B、数据映射
C、数据组织
D、数据聚类
11、[多选题] 关于R语言扩展包下列正确的是()A、network可创建带有点和边的网络图
B、animation可制作一系列的图像并将它们串联起来做成动画
C、ggmaps通过树图来可视化层次型数据
D、protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
12、[判断题] 数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。A、对
B、错
13、[多选题] 医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()A、多态性
B、时效性
C、不完整性
D、冗余性
14、[单选题] 大数据的最显著特征是() 。A、数据规模大
B、数据类型多样
C、数据处理速度快
D、数据价值密度高
15、[判断题] Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。A、对
B、错
16、[判断题] 规则性分析(Prescriptive Analysis)用于解决决策制定和提高分析效率A、对
B、错
17、[多选题] 数据变换的常用方法有##,##,##,##A、中心化变换
B、极差规格化变换
C、标准化变换
D、对数变换
18、[判断题] 空间视图提供了交通堵塞的概览A、对
B、错
19、[单选题] 数据清洗的方法不包括A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
20、[多选题] 大数据采集主要包括()四种。A、系统日志采集
B、网络数据采集
C、数据库采集
D、其他数据采集
21、[单选题] SAN是一种()A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA
22、[判断题] 基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。A、对
B、错
23、[判断题] 用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。A、对
B、错
24、[多选题] 云计算的特点是()A、大规模
B、高扩展性
C、虚拟化
D、按需分配
25、[单选题] PaaS是()的简称A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
26、[单选题] 以下不是数据仓库基本特征的是()A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
27、[多选题] 网络数据采集常用的是通过##或##等方式从网站上获取数据信息。A、网络爬虫
B、网站公开API
C、手动获取
28、[多选题] 常见的分类方法有A、决策树
B、贝叶斯网络
C、遗传算法
D、FP算法
29、[判断题] 数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。A、对
B、错
30、[单选题] GFS中的文件切分成()的块进行存储A、32MB
B、64MB
C、128MB
D、1G
31、[多选题] 大数据在医疗中的应用有()A、流行性疾病预防
B、慢性病健康管理
C、临床决策支持
D、医疗器械研发
32、[单选题] 下列哪个R语言扩展包可以创建带有点和边的网络图()A、ggplot2
B、network
C、ggmaps
D、animation
33、[判断题] R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。A、对
B、错
34、[单选题] 基础设施即服务的英文简称是A、IaaS
B、PaaS
C、SaaS
35、[判断题] 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。A、对
B、错
36、[多选题] 常见的非结构化数据有()A、web网页
B、即时消息
C、富文本文档
D、实时多媒体数据
37、[判断题] 数据流要表现出流数据的特征,反映的是系统中流动的数据;A、对
B、错
38、[多选题] 数据处理的两种方法是##,##A、批处理
B、流处理
C、单个处理
D、交叉处理
39、[单选题] 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A、ggplot2
B、network
C、ggmaps
D、animation
40、[多选题] 数据归约(Data Reduction)主要有()A、维度规约
B、样本规约
C、数据聚集
D、离散化概念分层
41、[多选题] 大数据在教育中的应用A、网上公开课
B、慕课
C、智慧校园
D、翻转课堂
42、[单选题] 大数据的特点不包含A、数据体量大
B、价值密度高
C、处理速度快
D、数据不统一

