1.5 数据与大数据 同步练习(含答案) 2024-2025学年高中信息技术浙教版(2019)必修一

资源下载
  1. 二一教育资源

1.5 数据与大数据 同步练习(含答案) 2024-2025学年高中信息技术浙教版(2019)必修一

资源简介

1.5 数据与大数据
一、选择题
1.百度根据用户的浏览记录,推断用户的爱好并推送相应的信息,这些信息包含有百度百科、网页、图像、音视频等数据。从互联网产生大数据的角度看,这一应用突出了大数据特征( )
A.数据类型繁多 B.数据生成速度快 C.数据体量巨大 D.数据价值密度低
2.一家大型零售公司长期以来一直依赖传统的市场调查和经验来进行商品定价和库存管理。然而,随着大数据技术的兴起,公司开始收集并分析大量的消费者购物行为数据,以更精确地了解消费者的需求和购买决策过程。大数据改变的不仅是数据,还有人们的思维。针对此,以下描述正确的是( )
A.大数据强调对事物因果关系的分析 B.大数据不接受数据的混杂性
C.大数据分析的是抽样数据 D.大数据更加注重事物的相关性
3.下列行为可能使用大数据的是( )。
①为了避免堵车,利用高德地图,查看道路拥堵情况 ②利用人脸识别打开门禁道闸,进入校园
③水银温度计上显示当前气温是30℃ ④全民K歌提示你打败了全国90%的人
⑤微信运动显示你今天走了10000步
A.①②③④ B.①②④⑤ C.②③④⑤ D.①②③④⑤
4.海南自贸港物流监管服务系统采用大数据技术,以道路、水路、铁路、航空运输等信 息资源共享为基础, 整合接入了交通部、海关、铁路公司等 42 个单位的 62 个系统数据, 采集了海口、三亚、洋浦等16个码头的物流数据和监控视频,最终形成进出岛物流数据资源库,为自贸港物流的正常运营提供强有力的服务。下列关于大数据技术的说法,不正确的是( )。
A.由 42 个单位 62 个系统产生的数据体量巨大, 体现了大数据的巨量性
B.庞大的数据量中可能产生价值的只是其中非常小的部分,说明该系统应用价值不高
C.该系统中的物流数据和监控视频等包含的数据种类繁多,体现了大数据的多样性
D.该系统能在很短的时间内处理大最的数据, 体现了大数据存取速度快的特点
5.请描述大数据的五个主要特征,并简要说明每个特征的含义。
6.下列有关“电商客服机器人”的说法,正确的是( )
A.客户的文本语料属于非结构化数据
B.商品销售比例图适合采用环形图
C.基于规则的中文分词方法已在实际应用中广泛使用
D.客服机器人可采用批处理计算处理数据反馈来实时调整推荐商品
7.关于大数据和大数据处理,下列说法不正确的是( )
A.大数据的特征是数据量大、速度快、数据类型多、价值密度低
B.大数据分析的是抽样数据,让决策更精准
C.处理大数据时一般采用分治思想
D.道路交通中实时产生的数据属于流数据
8.火车作为中国交通运输的动脉,每年仅春运就承担了约10亿人次的运输。在互联网和移动终端普及的今天,通过网络购票成为了最佳选择。系统通过大数据技术,对购票的实时数据进行合理分析,精准调配列车运行车次。下列关于大数据的说法,正确的是( )
A.大数据就是数据量巨大的数据 B.大数据指数据量庞大、价值密度高的数据
C.大数据应用不会泄露用户隐私信息 D.大数据分析一般采用分治思想
9.从互联网思维的角度来看,大数据具有的特征是( )
A.大量、多样、低价值密度、高速
B.分布式存储、分布式并行计算
C.样本渐趋于总体,精确让位于模糊,相关性重于因果
D.确定性和时效性
10.对近八年高考作文题的作文范文、历年新闻热点等数据进行深度挖掘分析,预测高考作文的命题方向。说明大数据具有以下哪项特点( )
A.价值性 B.迅变性 C.单一性 D.传递性
11.下列关于大数据的说法,正确的是( )
A.大数据指数据量庞大、价值密度高的数据
B.一般采用分治思想进行大数据分析
C.系统可以使用批处理计算对购票的实时数据进行分析
D.大数据应用不会泄露用户隐私信息
12.下列场景中没有体现大数据技术应用的是( )
A.朋友圈推送感兴趣的广告 B.金融机构对客户进行信用评估
C.手机导航给出假期出行路线建议 D.根据班级学生体质情况给出膳食意见
13.12306网站于 2011年 6月 12日正式投入购票业务,在北京、上海、广州、武汉、西安、沈阳等多地设置了服务器,为社会提供车票发售、列车时刻查询等服务,近日访问量达到了 532亿次。在春运期间,12306根据以往的出行数据,预测客流趋势,优化运力调配,制定多项决策,以更好满足旅客的需求。下列关于大数据的说法正确的是( )
A.使用批处理计算实时分析用户行为
B.12306网站中历年旅客流动数据属于流数据
C.需要分析旅客出行的原因以做出更准确的客流趋势预测
D.可以利用以往的出行大数据制定优化决策,说明大数据的价值高
14.利用大数据预测人流密集、监测疫情动向,一键上报疫情检查情况,实时生成疫情报告数据等进行疫情防控,下列没有用到大数据技术的是( )
A.用户利用“城市热力图”等提供的信息,避开人流密度高的地区
B.绘制确诊病人入院前的行动轨迹,查找与之密切接触人员的去向
C.在超市、银行等公共场所,用手持测温仪测量人员的体温数据
D.相关机构实时采集各地的数据,进行每天的疫情信息发布
15.下列关于数据、信息、知识以及大数据相关说法不正确的是( )
A.中国大量古代典籍已消失在历史长河中,说明信息具有载体依附性
B.信息是数据经过存储、分析及解释后所产生的意义
C.智慧是在知识的基础上,形成对事物的远见
D.大数据分析时,要确保每个样本准确,以便探求事物因果关系
16.下列有关大数据的说法,不正确的是( )
A.大数据要分析的是抽样数据,而不是全体数据
B.大数据的速度快不仅指数据产生的速度快,还指数据处理的速度快
C.大数据不再追求个别数据的精确性,允许数据混杂
D.大数据价值密度的高低与数据总量的大小成反比
二、填空题
17.从互联网产生的大数据角度看,其最显著特征是 。
18.用软件聊天、摄像头监控时,每天都会产生海量数据,这突出体现了大数据产生速度快、体量 、类型多、价值密度低的特征。
19.某地智慧交通平台每天获取交通卡刷卡记录1900万条,手机定位数据1800万条,这种无法在可承受时间用常规软件工具进行处理的数据,被称为 。
20.大数据是以 大、 多、 快、 高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行 、 和 ,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
三、判断题
21.大数据的特征包括数据量大、处理速度快、数据类型单一和价值密度高。( )
22.POI(Point of Interest)可以翻译成“兴趣点”,也称为“信息点”。( )
23.大数据是指大量的数据。( )
24.大数据的最显著特征是数据处理速度快。( )
25.大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产( )
参考答案:
1.A
【详解】本题主要考查大数据的特征。大数据的特征有:数据类型繁多、 数据生成速度快、 数据体量巨大、 数据价值密度低。由题干“这些信息包含有百度百科、网页、图像、音视频等数据”,可知这一应用突出了大数据特征数据类型繁多,故本题选A选项。
2.D
【详解】本题考查大数据相关内容。大数据分析的是全体数据,更加注重事物的相关性,而不是强调对事物因果关系的探究, 能够接受数据的混杂性。ABC选项说法错误,D选项说法正确。故本题答案是D选项。
3.B
【详解】本题考查大数据相关知识点
①②④⑤是从海量的数据范围里进行分析,处理,得到结果的。③水银温度计上显示当前气温是30℃,不涉及从很多数据中分析,没有使用到大数据。故本题选B选项
4.B
【详解】本题主要考查大数据技术。大数据具有价值密度低的特性,庞大的数据量中可能产生价值的只是其中非常小的部分,不能说明该系统应用价值不高,故本题选B选项。
5.大数据的五个主要特征是体量(Volume)、多样性(Variety)、速度(Velocity)、真实性(Veracity)和价值(Value)。体量指数据的规模;多样性指数据类型的多样性;速度指数据生成和处理的速度;真实性指数据的准确性和可信度;价值指数据中蕴含的有用信息和知识。
【详解】本题考查大数据特征。大数据的五个主要特征是体量(Volume)、多样性(Variety)、速度(Velocity)、真实性(Veracity)和价值(Value)。体量指数据的规模,即数据量的大小;多样性指数据类型的多样性,包括结构化数据、半结构化数据和非结构化数据等不同类型;速度指数据生成和处理的速度,强调数据处理的实时性和即时性;真实性指数据的准确性和可信度,确保数据的来源可靠、完整和准确;价值指数据中蕴含的有用信息和知识,即通过分析和挖掘数据可以获得的业务洞察和价值。
6.A
【详解】本题考查大数据。B选项错误,商品销售比例图采用饼图比较合适;C选项错误,基于规则的中文分词方法目前还处于试验阶段;D选项错误,客服机器人可采用流计算处理数据反馈来实时调整推荐商品。故答案为:A。
7.B
【详解】本题主要考查大数据和大数据处理。大数据的特征是数据量大、速度快、数据类型多、价值密度低;大数据分析的是全部数据;处理大数据时一般采用分治思想;道路交通中实时产生的数据属于流数据,故本题选B选项。
8.D
【详解】本题考查是大数据相关知识。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,选项A说法错误;大数据价值密度低,选项B说法错误;大数据应用会泄露用户隐私信息,选项C说法错误;大数据分析一般采用分治思想,选项D说法正确。故选D。
9.C
【详解】本题考查大数据特征相关内容。大数据具有“4V”特征:大量(Volume)、多样(Variety)、价值(Value)、高速(Velocity)。从互联网思维的角度来看,大数据具有样本渐趋于总体,精确让位于模糊,相关性重于因果。从大数据存储于计算的角度来看,大数据具有分布式存储,分布式并行计算。故本题答案是C选项。
10.A
【详解】本题考查的是大数据特点。对近八年高考作文题的作文范文、历年新闻热点等数据进行深度挖掘分析,预测高考作文的命题方向。说明大数据具有价值性。故选A。
11.B
【详解】本题考查的是大数据的描述。大数据具有数据体量大、速度快、数据类型多、价值密度低的特点,A选项错误;静态数据适合批处理,流数据适合实时计算,图数据需要进行图计算,C选项错误;大数据应用会泄露用户隐私,D选项错误。故选B。
12.D
【详解】本题考查的是大数据应用。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。根据班级学生体质情况给出膳食意见没有体现大数据技术应用。故本题应选D。
13.D
【详解】本题考查大数据相关内容。A选项,批处理是指在特定时间跨度内批量处理大量数据;流处理是指在产生连续数据流时立即对其进行处理;实时分析用户行为需要使用流处理来计算,选项错误。B选项,流数据一般指实时产生的数据流,例如传感器数据、日志数据等;批数据一般指离线处理的数据,例如从数据库中导出的数据、历史数据等;12306网站中历年旅客流动数据属于批数据,选项错误。C选项,准确的客流趋势预测只需要分析旅客的出行数据,不需要分析旅客出行的原因,选项错误。D选项,可以利用以往的出行大数据制定优化决策,说明大数据的价值高,选项正确。故本题答案是D选项。
14.C
【详解】本题主要考查大数据的应用。绘制确诊病人住院前的行动轨迹,查找与之密切接触人员的去向;相关机构实时采集各地的数据,进行每天的疫情信息发布;用户利用“城市热力图”等提供的信息,避开人流密度高的地区,均属于大数据技术的应用,数据保存在后台数据库中。在超市、银行等场所,用手持测温仪测量入场人员的体温数据,没有用到大数据技术,故本题选C选项。
15.D
【详解】本题考查的是大数据相关知识。从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果。故大数据分析时,并不要确保每个样本准确。本题应选D。
16.A
【详解】本题考查的是大数据特征。大数据的特征:(1)从互联网产生大数据的角度来看,大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)(2)从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果。(3)从大数据存储与计算的角度来看,大数据具有两个特征:分布式存储和分布式并行计算。故本题应选A。
17.数据体量巨大
【详解】本题考查的是大数据特征。本题主要考查大数据的特征。从互联网产生的大数据角度来看,大数据具有4V特征,分别是:大量、多样、低价值密度、高速,其中最显著特征是数据体量巨大。
18.大/巨大
【详解】本题主要考查大数据的特征。用软件聊天、摄像头监控时,每天都会产生海量数据,这突出体现了大数据产生速度快、体量大、类型多、价值密度低的特征。
19.大数据
【详解】本题主要考查大数据的概念。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。
20. 容量 类型 存取速度 应用价值 采集 存储 关联分析
【详解】本题考查的是大数据相关知识。大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
21.错误
【详解】本题考查大数据特征。大数据的特征之一是数据类型的多样性(Variety),而不是单一性;同时,由于大数据中包含了大量的信息,但真正有价值的信息可能只占据很小的一部分,因此价值密度相对较低(Value),而不是高。综上所述,大数据的主要特征包括数据量大、处理速度快、数据类型多样和价值密度低。这些特征使得大数据处理和分析需要采用新的技术和方法,以应对其带来的挑战和机遇。故题干说法错误。
22.正确
【详解】本题考查POI的概念。POI是Point of Interest的缩写,可以翻译成“兴趣点”,也称为“信息点”。故说法正确。
23.错误
【详解】本题考查大数据的概念。大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。故表述错误。
24.错误
【详解】本题主要考查大数据的特征。大数据的最显著特征是数据规模大,故表述错误。
25.正确
【详解】本题主要考查大数据的描述。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,表述正确。

展开更多......

收起↑

资源预览