大数据导论期末考试试卷题量:27满分:100.0截止日期:2020-06-2516:00一、单选题.分布式系统比较常见的数据分布方式有()A、哈希方式B、按数据范围分布C、按数据量分布D、一致性哈希E、以上都是我的
答案
八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案
:E.以下选项不属于可视化基本特征的是()A、易懂性B、全面性C、必然性D、专业性我的答案:B.数据清洗的方法有()A、填充缺失值B、修改错误值C、消除重复MATCH_
word
word文档格式规范word作业纸小票打印word模板word简历模板免费word简历
_1714332910932_1D、以上都是我的答案:D.以下不属于云计算的服务模式的选项是()A、IaaSPaaSSaaPDSaaS我的答案:C5.哪一年是中国的微博元年?20082009C、20102011我的答案:C._是大数据的前沿技术。A、数据处理B、数据分析C、数据定义D、数据结构我的答案:B.大数据赖以生存的土壤是A、互联网B、物联网C、网络信息D、前沿技术我的答案:A二、多选题.以下是大数据存储面临的挑战的选项是()A、系统问题B、数据问题C、应用问题D、管理问题我的答案:ACD.目前来说,以下选项是解决数据集成的主要难题的是。A、异构性B、分布性C、自治性D、同构性我的答案:AB.数据挖掘常用算法有()A、分类B、聚类C、特征分析D、决策树归纳法我的答案:ABCD.大数据的采集方法有()A、系统日志采集方法B、网络数据采集方法C、数据库采集D、以上都不正确我的答案:AB.以下属于云计算的特点的是()A、资源池弹性可扩张B、虚拟化C、以人为中心D、高可靠和安全性我的答案:ABD三、判断题.大数据分析是大公司或是科技大厂的专利我的答案:x.数据预处理是指在主要的处理后对数据进行的一些处理我的答案:x.只要有数据,就必然存在安全与隐私的问题。我的答案:,.在数据处理方面,有一个著名的秒定律”,即要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值。我的答案:,.与Oracle性能关系最大的是SGA我的答案:,四、填空题.存储系统的类别有()、()、()我的答案:第一空:块存储第二空:文件存储第三空:对象存储.NoSQL数据库是()的缩写。我的答案:第一空:NotOnlySQL.()是大数据分析和应用的基础,()和()是数据分析的第一步我的答案:第一空:数据第二空:数据采集第三空:预处理.大数据的4V特征分别是(),(),(),()我的答案:第一空:容量大(Volume)第二空:多样性(Variety)第三空:价值高(Value)第四空:速度快(Velocity).Hadoop核心模块包括()和()我的答案:第一空:HDFS第二空:MapReduce五、简答题.列举常用的大数据可视化软件与工具。我的答案:ExcelProcessingECharts.数据集市与数据仓库的区别。我的答案:数据仓库向各个数据集市提供数据。前者是企业级,规模较大,后者是部门级,相对规模较小。若干个部门的数据集市组成一个数据仓库。数据集市开发周期短、速度快,数据仓库开发周期长、速度慢。从其数据特征进行分析,数据仓库中数据结构采用
规范
编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载
化模式,数据集市中的数据结构采用星型模式。通常数据仓库中的数据粒度比数据集市中的粒度要细。.述数据仓库的构建步骤。我的答案:数据抽取、数据转换、数据装载、元数据管理.请回答大数据的4V特征?我的答案:容量大(Volume)多样性(Variety)价值高(Value)速度快(Velocity).简述什么是数据采集?我的答案:是大数据生命周期中的第一个环节,通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得各种类型的结构化、半结构化、即非结构化的海量数据。