粤教版 必修1 第五章 数据处理和可视化表达 单元练习(附答案解析)

资源下载
  1. 二一教育资源

粤教版 必修1 第五章 数据处理和可视化表达 单元练习(附答案解析)

资源简介

粤教版 必修1 第五章 数据处理和可视化表达 单元练习
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.下列选项中,哪个不是大数据的典型应用( )
A.基于交易大数据分析用户的购买习惯
B.基于搜索引擎的搜索关键词分析社会热点
C.基于道路摄像头、地感线圈等数据分析城市交通情况
D.基于科技文献数据库检索某一领域研究进展
2.有关大数据的说法,下列正确的是( )
A.大数据一般用于分析抽样数据 B.大数据采集的数据都是结构化数据
C.大数据更加注重事物的相关性 D.用大数据进行处理时,必须保证每个数据都准确无误
3.大数据已经进入了人们的生活,关于大数据的说法,不正确的是( )
A.大数据是未来信息技术产业的一种原料,可以从中提取很多有效信息
B.在很多情况下,大数据的来源可以不依靠人工
C.大数据信息量很大,蕴藏的信息价值密度高
D.在大数据中,个别极端数据不会影响大数据分析结果
4.2022年北京冬季奥运会圆满结束,这不仅是一场体育盛会,也是一场文化盛宴、科技盛会。从充满文化韵味的“二十四节气”倒计时,到脱胎于篆刻、书法的冬奥标识;从创意源于西汉长信宫灯的冬奥会火炬接力火种灯,到取自《千里江山图》的冰场挡板图案,从展现文明交流交融的“黄河之水”,到最终幻化成“冰雪五环”……中华文化与奥运文化、冰雪元素完美融合,闪耀冬奥舞台,写下文明交流互鉴的新篇章。小明使用百度指数,以“冬奥会比赛项目”为关键词进行分析,得到大家对于比赛项目关注情况的图谱(如图),以数据可视化形式迅速展示要点信息。该图谱采用的是( )
A.词云分布图 B.网络关系图 C.雷达图 D.热力图
5.2020年12月31日,国家主席习近平发表了2021年新年贺词,贺词的词云图如下列说法错误的是( )
A.在整篇贺词中,“我们”一词是被提的最多的
B.词云图显示了贺词中出现的所有词语
C.词云图可以通过文字大小、字体颜色来展现词语出现的频率
D.词云图是一种将文本进行可视化表达的方式
6.有关某“无人超市”的信息系统结构图如图所示,下列有关“无人超市”的说法,正确的是( )
A.系统通过入口处刷脸获得的特征值属于个人一般信息
B.零购物码和出门二维码使用后失效,体现了信息的时效性
C.系统自动对用户数据进行加密是为了提高数据的完整性
D.存储在系统数据库中的海量用户信息属于大数据
7.2022年北京冬季奥运会圆满结束,这不仅是一场体育盛会,也是一场文化盛宴、科技盛会。从充满文化韵味的“二十四节气”倒计时,到脱胎于篆刻、书法的冬奥标识;从创意源于西汉长信宫灯的冬奥会火炬接力火种灯,到取自《千里江山图》的冰场挡板图案,从展现文明交流交融的“黄河之水”,到最终幻化成“冰雪五环”……中华文化与奥运文化、冰雪元素完美融合,闪耀冬奥舞台,写下文明交流互鉴的新篇章。通过统计分析海量网民在网上行为数据,百度发布《百度热搜·北京冬奥会大数据》,以此了解人们对北京冬奥会的关注热度。说明大数据时代强调( )
A.寻找事物之间的因果关系,而不是相关关系 B.追求数据的精确性,而不是模糊性
C.要分析的是全体数据,而不是抽样数据 D.数据价值密度的高低与数据总量的大小成正比关系
8.因疫情防控需要,学校要求学生家长及时上报体温、行程等数据,汇总后上报上级防控部门,采集上述数据最为高效的方法是( )
A.填写在线收集表 B.填写纸质表格 C.发送电子邮件 D.打电话上报
9.下列关于大数据的描述中,不正确的是( )
A.大数据专指Excel软件收集、加工的数据
B.物联网、云计算、手机、电脑都是数据的来源
C.互联网生成的数据量正以爆发性的速度不断增长
D.在科学实验中,各种传感器每时每刻的速度不断增长
10.下列有关大数据的说法,正确的是( )
A.大数据采集的数据有结构化、半结构化和非结构化的。
B.大数据的分析是抽样数据。
C.用大数据进行数据处理时,必须保证每个数据都准确无误。
D.在大数据时代,数据的主要来源还是人力。
11.在高中学习《信息技术》课程后,张明对数据搜索、整理、分析和预测方面产生了浓厚的兴趣,想报考大学的数据相关专业,请判断以下专业中与大数据最贴近的是( )
A.汉语言文学专业 B.统计专业 C.化学专业 D.历史专业
12.“抖音”APP会针对用户喜好推送视频。该推送功能是基于对大数据的分析,在进行大数据分析时不需要的操作是( )
A.收集、分析用户在不同视频上停留的时间 B.分析关键词所属的视频类别
C.采集用户搜索的关键词 D.统计用户使用抖音的时间
13.下列设备适合采集视频素材的是( )
A.打印机,绘图仪 B.扫描仪,数码相机 C.话筒,音箱 D.智能手机,数码摄像机
14.2022年,我国新冠疫情形势依然严峻,在疫情防控面前,大数据提供了科技支撑,助力疫情精准防控。下列应用中没有用到大数据技术的是( )
A.利用“城市热力图”,避开人流密度高的地区
B.超市用手持测温仪测量进场人员体温
C.绘制确诊病人的行动轨迹,查找密接者
D.政府实时采集数据进行疫情信息发布
15.以下关于对大数据特点的叙述中不正确的是( )
A.数据价值密度高 B.数据类型多样 C.数据处理速度快 D.数据规模大
16.标签云(词云)用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的 形式代表词语的重要性。下列不适合用标签云(词云)来呈现的是( )
A.政府年度工作报告中的关键词
B.学生期末考试成绩
C.《全唐诗》常用的词语
D.《红楼梦》中人物出现的次数
17.下列关于大数据的说法错误的是( )
A.大数据仅仅是数据的体量大 B.大数据可以帮助传统行业
C.大数据会带来机器智能 D.大数据是一种思维方式
18.下列关于数据的说法,正确的是( )
A.计算机数据管理主要经历了人工管理、文件管理、大数据管理三个阶段
B.MD5、CRC、SHA-1 是常用的数据加密算法
C.静态数据常在计算时不会发生改变,流数据的价值随时间增加
D.文本数据处理过程主要包括分词、特征提取、数据分析、结果呈现
19.数据的采集方法有人工获取和自动采集,下列哪一个不是自动采集的是( )。
A.物联感知 B.视频监控 C.文献调研 D.网络平台
20.有关部门使用大数据技术,进行疫情防控,有关大数据的说法不正确的是( )
A.相关机构实时采集各地相关数据,每天发布疫情数据,用到了大数据技术。
B.大数据要分析的是全体数据。
C.超市、商场、医院等场所,使用手持设备测量入场人员体温,使用了大数据技术。
D.疫情期间,部分群众没有去过中高风险地区,也没有接触过确诊病例等,但健康码变色了,说明大数据允许个别不准确数据存在。
21.监控不间断地录制视频产生了大量的视频数据,而有用的数据可能仅有十几秒,这体现了大数据的( )特征。
A.数据类型繁多 B.资源可共享 C.价值密度低 D.变化速度快
22.下列关于大数据的说法,正确的有:( )
A.当数据量很大时,可以抽取部分数据作为大数据的数据源
B.对于大数据不再追求精确性,而是能够接受数据的混杂性
C.大数据产生的速度快,处理速度可以慢一些
D.大数据让我们的生活更便利,百利而无一害
23.关于大数据和大数据处理,下列说法不正确的是( )
A.大数据的特征是数据量大、速度快、数据类型多、价值密度低
B.大数据分析的是抽样数据,让决策更精准
C.处理大数据时一般采用分治思想
D.道路交通中实时产生的数据属于流数据
24.在2022年冬奥会上,各大赛场赛场安装了多个高清摄像机,实时记录比赛情况,以确保公正制裁。摄像机记录信息的过程属于( )
A.数据可视化表达 B.数据分类 C.数据分析 D.数据采集
25.下列关于数据可视化的描述中不正确的是( )
A.数据可视化增强了数据的解释力与吸引力 B.数据可视化是将数据以图形图像等形式表示
C.数据可视化可以直观地呈现数据中蕴含的信息 D.标签云是基于语句的文本内容可视化
二、判断题
26.大数据的特点是数据量超大,起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。( )
27.互联网、智能终端等源源不断产生海量数据,数据传输能力从TB、PB级攀升至EB、ZB级。这一变化主要体现了大数据体量巨大的特征。( )
28.数据可视化表达工具只能处理静态数据,无法处理动态变化的数据。( )
29.数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。( )
30.高德地图根据用户实时上报的交通信息,通过大数据平台整合各种信息,给出相应的路线。 ( )
31.大数据其实就是大型数据库系统。( )
32.数据可视化是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等。( )
33.大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。 ( )
34.微信支付、支付宝支付、滴滴打车等都包含着大数据在生活中的应用。( )
35.数据分析的方法主要有对比分析、平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,来反映总体在一定时间、地点条件下某一数量特征的一般水平。 ( )
三、操作题
36.情景二:大数据时代
在日常工作、生活和学习等活动中,人们的数字化活动都会产生数据,使用导航出行、拨打电话、发送微信、网上浏览查阅资料、线上购物…人类社会活动产生了海量的数据正确、高效地对这些数据进行采集、存储、处理,并发掘数据中的价值,将对人类社会生活带来更大的积极影响。
围绕以上情景,回答下题。
(1)在大数据时代,网络信息的采集是一项重要的工作,如果单纯靠人力进行网络信息采集,不仅低效繁琐,搜集的成本也会提高。此时,我们可以合法使用( )对网络数据进行自动采集。
A系统日志 B.网络爬虫 C.传感器 D.问卷调查
(2)大数据存储技术是大数据领域的另一个关键技术,人们利用( )代替集中式存储,这种存储方式能够支持多台处理器或多个计算机节点并行计算来提高解决问题的效率。
A分布式存储 B.本地存储 C.移动存储 D.磁带存储
(3)某国的一家大型连锁超市通过利用信息系统对大量的销售数据进行了特定的分发现一个“奥秘”,于是这家超市就把尿布和啤酒这两种看起来没有关联的商品摆放在一起销售,结果销售量大幅增加。原来,超市经营者从数据分析中发现,婴儿尿布通常是男人们下班时购买的,而他们在购买尿布时又会顺便购买自己爱喝的啤酒。这个案例中的超市信息系统应用了大数据分析中的哪种技术?( )
A.聚类分析 B.关联分析 C.分类分析 D.回归分析
(4)导航软件提供了“未来出行”功能,用户可以设定未来出行时间,软件利用大数据分析,预估未来行程所需时长,为用户合理规划出行时间提供参考。这一功能凸显了大数据分析的哪一个核心作用?( )
A.了解事物的现状 B.剖析事物的发展历程
C.预测事物的未来走向 D.数据价值化
(5)如图是一张火车票,上面有时间、目的地、身份证号码等数据,则下列说法错误的是( )
A.数据采集技术的迅速发展,数据的表现形式也越来越多样化,给人们的生活带来了巨大的改变
B.只有云计算、物联网、大数据等技术才能体现数据与生活
C.在人们的日常生活中数据无处不在
D.对于身份证号码等涉及个人隐私的数据要注意保护
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.D
【详解】本题主要考查大数据的应用。大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。基于科技文献数据库检索某一领域研究进展不符合大数据的定义,故本题选D选项。
2.C
【详解】本题主要考查大数据的描述。大数据要分析的是全体数据,而不是抽样数据;大数据采集系统需要采集大量的视频、音频、照片等非结构化数据,以及网页、博客、日志等半结构化数据;大数据具有低价值密度性,所以大数据无需保证每个数据都准确无误,故本题选C选项。
3.C
【详解】本题主要考查大数据的描述。大数据是未来信息技术产业的一种原料,可以从中提取很多有效信息;在很多情况下,大数据的来源可以不依靠人工;大数据信息量很大,蕴藏的信息价值密度低;在大数据中,个别极端数据不会影响大数据分析结果,故本题选C选项。
4.A
【详解】本题主要考查数据可视化。“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。由图可知,该图谱采用的是词云分布图,故本题选A选项。
5.B
【详解】本题主要考查词云的描述。由图可知,在整篇贺词中,“我们”一词是被提的最多的;词云图并未显示了贺词中出现的所有词语;词云图可以通过文字大小、字体颜色来展现词语出现的频率;词云图是一种将文本进行可视化表达的方式,故本题选B选项。
6.B
【详解】本题主要考查信息系统的描述。系统通过入口处刷脸获得的特征值属于信息的比对;零购物码和出门二维码使用后失效,体现了信息的时效性;系统自动对用户数据进行加密是为了提高数据的安全性;大数据是一种大规模在获取、存储、管理、分析等方面超出了传统数据库软件工具能力范围的数据集合,仅仅超市的用户信息算不上大数据,故本题选B选项。
7.C
【详解】本题主要考查大数据的描述。通过统计分析海量网民在网上行为数据,百度发布《百度热搜·北京冬奥会大数据》,以此了解人们对北京冬奥会的关注热度。说明大数据时代强调要分析的是全体数据,而不是抽样数据,故本题选C选项。
8.A
【详解】本题主要考查数据采集。结合选项可知采集上述数据最为高效的方法是填写在线收集表,故本题选A选项。
9.A
【详解】本题主要考查大数据的描述。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更佳的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;物联网、云计算、手机、电脑都是数据的来源;互联网生成的数据量正以爆发性的速度不断增长;在科学实验中,各种传感器每时每刻的速度不断增长,故本题选A选项。
10.A
【详解】本题主要考查大数据的描述。大数据采集的数据有结构化、半结构化和非结构化的;大数据的分析是全部数据;用大数据进行数据处理时,无需保证每个数据都准确无误;在大数据时代,数据的主要来源是互联网,故本题选A选项。
11.B
【详解】本题主要考查大数据的描述。统计专业主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。统计专业与大数据最贴近,故本题选B选项。
12.D
【详解】本题主要考查大数据分析。“抖音”APP会针对用户喜好推送视频。该推送功能是基于对大数据的分析,在进行大数据分析时需要收集、分析用户在不同视频上停留的时间;分析关键词所属的视频类别;采集用户搜索的关键词。不需要统计用户使用抖音的时间,故本题选D选项。
13.D
【详解】本题考查的是信息采集工具。打印机、绘图仪是输出设备,扫描仪适合采集图像类素材,话筒适合采集音频素材,故本题应选D。
14.B
【详解】本题主要考查大数据技术的应用。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。超市用手持测温仪测量进场人员体温没有用到大数据技术,故本题选B选项。
15.A
【详解】本题主要考查大数据的特点。大数据的特点有:数据价值密度低、数据类型多样、数据处理速度快、数据规模大,故本题选A选项。
16.B
【详解】本题主要考查数据可视化表达。标签云(词云)用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的 形式代表词语的重要性。政府年度工作报告中的关键词、《全唐诗》常用的词语、《红楼梦》中人物出现的次数均可以用标签云(词云)来呈现,学生期末考试成绩不适合用标签云(词云)来呈现,故本题选B选项。
17.A
【详解】本题主要考查大数据的描述。大数据的特点是涉及的资料量规模巨大;大数据可以帮助传统行业;大数据会带来机器智能;大数据是一种思维方式,故本题选A选项。
18.D
【详解】本题主要考查数据的描述。数据管理主要经历了人工管理、文件管理、大数据管理三个阶段;Base64算法、MD5算法、AES算法、RSA算法、SHA-1是常用的数据加密算法,CRC是差错校验码;态数据在很长的一段时间内不会变化,一般不随运行而变;文本数据处理过程主要包括分词、特征提取、数据分析、结果呈现,故本题选D选项。
19.C
【详解】本题主要考查数据采集。物联感知、视频监控、网络平台均是自动采集,文献调研是人工获取,故本题选C选项。
20.C
【详解】本题主要考查大数据技术。相关机构实时采集各地相关数据,每天发布疫情数据,用到了大数据技术;大数据要分析的是全体数据;超市、商场、医院等场所,使用手持设备测量入场人员体温,没有使用大数据技术; 疫情期间,部分群众没有去过中高风险地区,也没有接触过确诊病例等,但健康码变色了,说明大数据允许个别不准确数据存在,故本题选C选项。
21.C
【详解】本题主要考查大数据的特征。数据规模大、数据规模类型多样、数据处理速度快、数据价值密度低均是大数据的特征。监控不间断地录制视频产生了大量的视频数据,而有用的数据可能仅有十几秒,这体现了大数据的价值密度低特征,故本题选C选项。。
22.B
【详解】本题主要考查大数据的描述。大数据是对全部的数据进行处理分析;对于大数据不再追求精确性,而是能够接受数据的混杂性;大数据特征之一是处理速度快;大数据是一把双刃剑,并非百利而无一害,故本题选B选项。
23.B
【详解】本题主要考查大数据和大数据处理。大数据的特征是数据量大、速度快、数据类型多、价值密度低;大数据分析的是全部数据;处理大数据时一般采用分治思想;道路交通中实时产生的数据属于流数据,故本题选B选项。
24.D
【详解】本题主要考查数据采集。各大赛场赛场安装了多个高清摄像机,实时记录比赛情况,以确保公正制裁。摄像机记录信息的过程属于数据采集,故本题选D选项。
25.D
【详解】本题主要考查数据可视化的描述。数据可视化增强了数据的解释力与吸引力; 数据可视化是将数据以图形图像等形式表示; 数据可视化可以直观地呈现数据中蕴含的信息; 标签云是对关键词的可视化,故本题选D选项。
26.对
【详解】本题考查的是大数据相关知识。大数据或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。题干中的说法是正确的。
27.正确
【详解】本题主要考查大数据的特征。互联网、智能终端等源源不断产生海量数据,数据传输能力从TB、PB级攀升至EB、ZB级。这一变化主要体现了大数据体量巨大的特征,表述正确。
28.错误
【详解】本题主要考查数据可视化的表达。数据可视化表达工具可以处理静态数据,也能处理动态变化的数据,故表述错误。
29.正确
【详解】本题考查的是数据的可视化表达。
30.对
【详解】本题主要考查大数据的应用。高德地图根据用户实时上报的交通信息,通过大数据平台整合各种信息,给出相应的路线,这正是大数据的优势。因此本题说法正确。
31.错误
【详解】本题主要考查大数据的描述。大数据和数据库系统是两个概念,大数据平台主要以分布式存储和分布式计算两大基础技术来展开,其中分布式存储就涉及到数据库系统,故表述错误。
32.正确
【详解】本题考查的是数据可视化。数据可视化是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等。题干的说法是正确的。
33.对
【详解】本题考查的是大数据。大数据指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。题干中的说法正确。
34.正确
【详解】本题考查的是大数据在生活中的应用。微信支付、支付宝支付、滴滴打车等都包含着大数据在生活中的应用。题干描述正确。
35.错
【详解】本题考查数据分析。对比分析法的定义 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。映总体在一定时间、地点条件下某一数量特征的一般水平是平均分析,题干概念混乱,说法错误。
36. B A B D B
【详解】本题考查的是大数据相关知识。(1)网络爬虫是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。故本题应选B。(2)分布式存储是一种数据存储技术,通过网络使用企业中的每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落。故本题应选A。(3)关联分析:分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。故本题应选B。(4)利用大数据分析,预估未来行程所需时长,为用户合理规划出行时间提供参考,这一功能凸显了大数据分析数据价值化的作用。故本题应选D。(5)在人们的日常生活中数据无处不在,不仅仅在云计算、物联网、大数据等技术体现数据与生活。故本题应选B。
答案第1页,共2页
答案第1页,共2页

展开更多......

收起↑

资源预览