2025届高中信息技术二轮复习 第一部分 信息与信息系统 专题1 数据与大数据(课件 学案)

资源下载
  1. 二一教育资源

2025届高中信息技术二轮复习 第一部分 信息与信息系统 专题1 数据与大数据(课件 学案)

资源简介

?
学习目标 
1.掌握数据的定义和表现形式;
2.掌握信息的定义以及信息是对数据解释的功能;
3.掌握知识、信息和智慧的关系;
4.掌握大数据定义和性质;
5.掌握大数据的思维及处理.
数据改变了人类生活,各种技术的发展依赖于数据。解释数据中包含的意义,形成信息。对同一类信息进行分析、综合,抽象出相关特性,形成知识。在实际生产生活中,采用不同的决策,灵活应用各类知识,体现人们的智慧。加工信息的过程,采用了各种处理信息的技术,因此信息技术改变着人类的生存方式。人类在各种软硬件设施支撑下,对各种数据进行信息加工,并通过通信网络进行交流,把信息技术运用到生活中,形成各种信息系统。随着传感技术和计算机技术的发展,能快速地获取和处理各种类型的大量数据,大数据技术不仅能处理结构化数据,还能处理非结构化数据,并获取大数据带来的价值。
(2024年1月浙江省选考)下列关于数据与信息的说法,正确的是(  )
A.数据以二进制方式编码后才能存储在计算机中
B.大数据技术不能处理非结构化数据
C.同一数据经解释后产生的信息都是相同的
D.信息加工处理后不会产生更有价值的信息
重难点1 数据、信息和知识的关系
数据是信息的载体,是看得见摸得着的具体事物,而信息是对数据的解释,是一种意义,往往是运用不同知识得到的解释结论。知识是公式、定理或经验的总结,可以利用知识解决实际生活中问题,综合运用多种知识解决同一问题,是智慧的体现。
例1 下列关于数据和信息的说法,正确的是(  )
A.在数据处理过程中不会有新的信息产生
B.信息的保存和传播可以不依附于载体
C.信息的价值因人而异,但信息不会有虚假
D.计算机中的数据表现形式不同,但都以二进制方式存储
变式1 下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体,只要有足够的数据,就获得了足够的信息
B.在数据处理的过程中,可能产生新的数据和信息
C.数据必须经过数字化,才能被加工处理
D.计算机中各种类型数据均采用二进制方式存储,且编码方式也相同
例2 下列关于数据和信息的说法,正确的是(  )
A.数据的表现形式只能是文字和图像
B.同一信息对所有人而言其价值是相同的
C.计算机中保存的数据可以是未经数字化的
D.信息是数据经分析、解释后得到的
变式2 去医院就诊时,出示电子医保电子凭证二维码进行挂号、结算等操作,如图所示。下列说法正确的是(  )
A.二维码是图形,不是数据
B.图中的“330***********9076”仅是数字,不具有意义
C.参保人的身份信息绑定在医保电子凭证中,这体现了信息的载体依附性
D.数据是数字经过储存、分析及解释后所产生的意义
重难点2 大数据
大数据的定义围绕数据体量巨大、速度快、种类繁多和价值密度低4个特性,可以从特性来看是否是大数据。大数据的思维体现在分析的是全体数据,而不是抽样数据;对于数据不再追求精确性,而是能够接受数据的混杂性;不一定强调对事物因果关系的探求,而是更加注重它们的相关性。大数据往往采用分治的思想进行处理,数据类型分别静态、流和图数据三种。
例1 下列关于数据和大数据的说法,正确的是(  )
A.数字和文字是数据常见的表现形式
B.未经数字化的数据不能被记录和传输
C.大数据蕴含着巨大的价值,价值密度很高
D.大数据为社会各层面带来便利,不存在任何安全隐患
变式1 在抗击疫情中,大数据技术发挥了重大作用,下列关于大数据的说法正确的是(  )
A.某校学生填写是否做过核酸的信息,由学校汇总后的数据属于大数据
B.基于大数据技术,个别数据不准确会影响数据分析
C.处理大数据的基本思想是并行处理的思想
D.在手机上填写个人资料后申领“健康码”的过程,涉及数据库技术
例2 高德地图APP在导航服务中调用北斗卫星系统,其日定位请求次数超过3000亿次,使道路交通情况预测的准确度得到提高。下列说法正确的是(  )
A.高德地图APP数据传输时不需要传输介质
B.根据交通路况实时更新导航路线采用批处理计算
C.用户在使用导航数据的同时自身也在产生数据
D.因导航中数据体量大,预测未来交通情况采取抽样数据分析
变式2 下列关于数据处理与应用的说法,正确的是(  )
A.大数据一般具有数据量大、处理速度慢、数据类型多、价值密度高的特征
B.所有的文本数据处理都依次经过数据分析、特征提取、分词和结果呈现四个步骤
C.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
D.在数据处理过程中,数据的质量不会影响数据分析的结果
重难点1 数据、信息和知识的关系
1.下列有关数据、信息的说法,正确的是(  )
A.一张光盘存储的图片不属于数据
B.计算机只能处理数字化后的数据
C.信息的表示、传播、存储不一定依附于某种载体
D.信息会因别人的获取而发生损耗
2.某高铁购票订单如图所示,下列说法正确的是(  )
A.该订单是信息
B.订单数据的表现形式只有数字
C.该车票是通过售票窗口购买的
D.“车票当日当次有效”体现了信息具有时效性
3.下列关于数据、信息和知识的说法,不正确的是(  )
A.文字是数据的一种表现形式
B.信息超出有效期后不再具有任何价值
C.三角形(已知三条边的长度)的面积可以根据海伦公式计算得到,这是知识的体现
D.面对同样的信息,不同的人可能形成不同的知识
4.下列关于数据与信息的说法,不正确的是(  )
A.在计算机中,数据一般以文件的形式存储
B.存储信息的载体遭到破坏,其承载的信息会消失
C.由室内净化器测得的数据可以获得室内空气质量相关信息
D.预订车票时,余票的数量是数据,座位等级不是数据
5.下列有关数据、信息、知识的说法,正确的是(  )
A.一张光盘上存储的文件是信息
B.信息可以不依附于载体而存在
C.信息在传递的过程中,会因为被获取发生损耗
D.知识是人类在社会实践中所获得的认识和经验的总和
6.下列关于数据与信息的说法,正确的是(  )
A.不同来源的数据表达的意义可能相同
B.信息在共享时会发生损耗导致历史文献失传
C.信息可以被处理、分析,但数据不能
D.从历史数据中获取的信息不具备价值
重难点2 大数据
1.下列关于数据与大数据的说法,正确的是(  )
A.经过数字化的数据才能被计算机存储和处理
B.大数据的数据分析常采用抽样数据的方法
C.大数据价值密度的高低与数据总量的大小成正比
D.同一数据不可以依附于不同载体
2.下列关于数据、信息和大数据的说法,不正确的是(  )
A.信息的存储必须依附于某种载体
B.在当今社会,计算机已成为数据处理的主要工具
C.信息是数据经过储存、分析及解释后所产生的意义
D.大数据的特征包括数据体量大、速度快、数据类型多、价值密度高
3.下列关于数据、信息和知识及大数据的说法正确的是(  )
A.信息对于不同的人群其价值是相同的
B.大数据改变的不仅是数据,还有人们的思维,大数据强调对事物因果关系的探求
C.大数据给生活带来便利的同时,也带来如信息泄露等安全问题
D.知识的获得是人利用自身已有的知识对信息进行加工重构得到新知,知识就是对信息的积累
4.下列关于大数据的说法,正确的是(  )
A.大数据指数据庞大、产生速度快、价值密度高的数据
B.处理大数据强调对事物因果关系的探求
C.一般采用分治思想处理大数据
D.道路交通大数据仅采用批处理方法
5.用某APP扫描共享单车上的二维码就能解锁,骑行后在指定区域上锁并听到类似“还车成功”的提示音即可完成一次租借。用户信息、租车时间等信息均储存于二维表结构中。下列关于数据、大数据的说法不正确的是(  )
A.每次租借共享单车的记录是数据
B.用户的共享单车租借数据属于结构化数据
C.大数据因为体量太大,只需抽取部分数据进行分析
D.通过大数据分析可以优化共享单车的放置地点和数量
6.下列关于大数据处理的说法,正确的是(  )
A.jieba模块是基于规则的分词方法的典型应用
B.典型的文本处理过程顺序为:数据分析→分词→特征提取→结果呈现
C.社交关系数据一般采用流计算模式进行处理
D.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
重难点1 数据、信息和知识的关系
1.下列关于数据和信息的说法,正确的是(  )
A.通过无线传输的信息可以不依附于载体
B.同一信息对所有人而言价值是相同的
C.数据是信息经过分析、解释后得到的
D.计算机可以存储数字化后的数据
2.下列关于数据与信息的说法,正确的是(  )
A.虚假的数据不能承载任何信息
B.同一信息只能依附于同一种载体
C.信息是数据经过储存、分析及解释后所产生的意义
D.信息被更多的人获取,损耗就会越多
3.下列关于数据和信息的说法,不正确的是(  )
A.结绳记事采用“大事大结,小事小结”,其中的绳结是数据
B.飞机票中的登机时间是数据
C.通过网络发布杭州亚运会金牌榜的信息无需载体
D.信息是数据经过储存、分析及解释后所产生的意义
4.下列关于数据、信息与知识的说法,不正确的是(  )
A.单独的一个数字在没有上下文的情况下没有意义
B.信息通过人的理解和经验补充后,可以转化为知识
C.计算机只能处理经过数字化后的数据
D.数据古代就有,但信息是计算机出现以后才有的
5.下列关于数据和信息的说法,正确的是(  )
A.数据在传输过程中丢失,那么其承载的信息也会消失
B.同一信息可以依附于不同载体,但该信息对不同的人有相同的价值
C.信息可以被加工处理,加工后信息的价值一定更高
D.数字化指的是将不连续的模拟信号转换为连续的数字信号的过程
6.下列关于数据和信息的说法,正确的是(  )
A.经加工处理后的假消息价值较低
B.人类对于数据的利用不信赖于载体
C.残缺的竹简无法还原历史文献,说明了载体依附性
D.用微信扫码支付时二维码在一定时间内自动更新,体现了信息的共享性
7.下列有关数据和信息的说法,正确的是(  )
A.计算机中的数据以二进制的形式存储
B.人们观看在线影视时,点播的视频是信息
C.信息本身会因为被别人获取而发生损耗
D.计算机是数据处理的唯一工具
8.下列关于数据和信息的说法,不正确的是(  )
A.计算机中存储的数据是可以未经数字化的
B.同一信息对于不同人群的价值可能是不一样的
C.信息是数据经过储存、分析及解释后所产生的意义
D.数据的表现形式可以是数字、文本、图像、视频等
9.下列关于数据、信息、知识与智慧的说法,正确的是(  )
A.同一个数据在不同的场景下其意义是一样的
B.人们可以直接使用搜索引擎获得海量知识
C.信息具有载体依附性,书籍中的文字就是信息
D.智慧是一种更高层次的综合能力,体现为一种卓越的判断力
10.下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体
B.相同的数据所承载的信息都是相同的
C.数据在处理过程中不会产生新的信息
D.只有虚假的数据,没有虚假的信息
11.下列关于数据和信息的说法,正确的是(  )
A.数据都以数字符号进行表示
B.信息共享会降低其价值
C.信息的存储与传递需要依附载体
D.分析不同数据得到的信息一定是不同的
12.下列关于数据、信息和知识的说法,正确的是(  )
A.数据的表现形式只有数字和文字
B.同一种信息的获取途径和方法可以不同
C.通过搜索引擎搜索出来的内容都是知识
D.信息的价值不会因为时间的变化而改变
13.小华家门口有条小河,他想知道小河的宽度,决定用勾股定理来求解。于是他在河岸边选取点A、点B、点C、点D,测得相关数据如图所示,最后求得小河宽度15m。
下列说法正确的是(  )
A.上述表述中的30是数据,数据就是数字,本身没有意义
B.∠CAD=30°表示直线AC与河岸线形成的夹角为30度,这是知识
C.勾股定理是数学家通过归纳、演绎等手段对信息进行挖掘后形成的知识
D.用勾股定理求小河宽度是智慧的体现
14.下列关于信息、知识和智慧的说法正确的是(  )
A.很多古代著作消逝于历史长河,说明信息共享会造成信息损耗
B.知识是人类在社会实践中所获得的认识和经验总和,可继承和传递
C.通过搜索引擎获得海量信息后,就获得了海量的知识
D.疫情期间,“发烧”就联想到得了“新冠”,这是智慧的体现
15.下列关于数据、信息和知识的说法,正确的是(  )
A.乘坐火车时不需要提供纸质火车票,说明信息可以不依附于载体
B.银联卡因失去磁性无法读取,这说明信息在重复使用中会产生损耗
C.数据以二进制或十六进制方式编码后,才能存储在计算机中
D.学生将老师整理的题目顺利解题,是运用已学知识的体现
16.关于数据与信息的说法,正确的是(  )
A.信息会随着载体形式的变化而变化
B.数据就是指数字
C.计算机对各类信息进行加工处理,本质上都是通过计算完成的
D.信息的显性价值是通过数据的加工处理而获得的
17.下列关于数据、信息与知识的说法,正确的是(  )
A.数据是信息经过储存、分析及解释后所产生的意义
B.人们可以在搜索引擎的帮助下获取海量的知识
C.名言“站在巨人肩膀上”说明信息可以继承和传递
D.“一百个人心中有一百个哈姆雷特”说明同样的信息可能建构不同的知识
18.下列有关信息、知识和智慧的理解不正确的是(  )
A.信息可以脱离它所反映的事物被存储、保存和传播
B.信息具有共享性,在传递过程中会产生损耗
C.知识是人类在社会实践中获得的认识与经验的总和,它可以继承和传递
D.智慧主要表现为收集、加工、应用、传递知识的能力以及对事物发展的前瞻性看法
重难点2 大数据
1.下列关于大数据的说法,正确的是(  )
A.大数据的数据体量巨大,价值密度高
B.处理大数据时,一般采用分治思想
C.大数据接受数据混杂,主要探求数据间的因果关系
D.大数据的应用,避免了用户隐私信息泄露的风险
2.下列有关数据安全与大数据的说法,正确的是(  )
A.大数据的数据类型多、数据处理速度快、价值密度高
B.大数据强调事物的因果关系,也注重数据之间的相关性
C.通过数据加密方法来提高数据的完整性
D.大数据带来便利的同时也会带来数据泄露、个人隐私等社会问题
3.下列关于大数据与大数据处理的说法,不正确的是(  )
A.大数据价值密度低,“提纯”大数据可以让其发挥更大的价值
B.高速公路中实时产生的车流量数据属于静态数据
C.词频统计是文本数据处理中特征提取的一种方法
D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据
4.下列关于大数据及数据处理的说法,不正确的是(  )
A.不同时刻产生的重复数据可直接删除以节省存储空间
B.处理大数据时一般采用分治思想
C.大数据要分析的是全体数据,能接受数据的混杂性
D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等
5.下列有关大数据处理的说法,不正确的是(  )
A.处理大数据时,一般采用分治思想
B.对历史数据一般采用批处理方式
C.大数据处理时要求所有的数据都准确
D.大数据分析的是全体数据,而不是抽样数据
6.关于大数据和大数据应用,下列说法不正确的是(  )
A.大数据追求数据的准确性,通过各种技术或人工手段来保证每个数据准确无误
B.基于用户购买行为的大数据,挖掘用户偏好,实现个性化推荐,属于大数据应用
C.大数据蕴含着巨大的价值,但是价值密度低
D.大数据更关注事物的相关性而不是因果关系
7.下列关于数据与大数据的说法,正确的是(  )
A.数据是指所有能输入到计算机且只能被计算机程序处理的符号总称
B.大数据的数据类型多,价值密度低
C.我们可通过数据加密和数据解密来提高数据的保密性和完整性
D.大数据要分析的是抽样数据,而不是全体数据
8.下列有关大数据与大数据处理的说法正确的是(  )
A.大数据可以采用抽样数据分析,目的是让处理速度更快
B.在大数据商品个性化推荐中,要分析人们购买商品的原因,从而提供精准推荐
C.文本数据处理一般先提取特征再进行分词、数据分析等处理
D.静态大数据的批处理可以和流数据的实时处理相整合,降低切换延时时间
9.下列关于大数据和人工智能的说法,正确的是(  )
A.用户在不同的时间登录同一个APP,其首页内容都不相同,是因为根据行为大数据做了精准推荐
B.某地图软件需要实时统计道路数据,发布车流﹑拥堵等信息,处理这些数据可用批处理计算
C.人工智能技术的发展改变人类生活﹑促进经济发展,可以解决所有问题
D.深度学习是以数据驱动的人工智能方法,但其仍需要事先构造知识库
10.下列关于大数据和大数据处理的说法,正确的是(  )
A.某校高二年级学生的学籍信息属于大数据
B.大数据时代,我们更强调事物因果关系的探求,而不是数据间的相关性
C.对于购物网站的广告推荐,一般采用批处理计算方式实现
D.某购物平台2023年“双11”的交易数据属于静态数据
11.下列关于大数据的说法,正确的是(  )
A.大数据强调对事物因果关系的探求,不注重它们的相关性
B.大数据是指无法在可接受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
C.大数据其实就是海量的数据,在大数据时代,少量的数据没有什么价值
D.道路的监控每天都在记录海量的数据,但发生交通事故之后往往只用到几十秒,甚至是几秒钟的数据,这反映了大数据的低价值性
12.下列有关大数据的典型应用,说法错误的是(  )
A.大数据经过合适的处理方式,能获得更高的数据价值
B.在金融行业利用大数据,可以评估用户信用等级
C.保险行业可利用大数据进行欺诈行为分析和精细化运营
D.大数据的应用只能让我们了解事物的现状,不能预测未来
?专题1 数据与大数据
学习目标 
1.掌握数据的定义和表现形式;
2.掌握信息的定义以及信息是对数据解释的功能;
3.掌握知识、信息和智慧的关系;
4.掌握大数据定义和性质;
5.掌握大数据的思维及处理.
数据改变了人类生活,各种技术的发展依赖于数据。解释数据中包含的意义,形成信息。对同一类信息进行分析、综合,抽象出相关特性,形成知识。在实际生产生活中,采用不同的决策,灵活应用各类知识,体现人们的智慧。加工信息的过程,采用了各种处理信息的技术,因此信息技术改变着人类的生存方式。人类在各种软硬件设施支撑下,对各种数据进行信息加工,并通过通信网络进行交流,把信息技术运用到生活中,形成各种信息系统。随着传感技术和计算机技术的发展,能快速地获取和处理各种类型的大量数据,大数据技术不仅能处理结构化数据,还能处理非结构化数据,并获取大数据带来的价值。
(2024年1月浙江省选考)下列关于数据与信息的说法,正确的是(  )
A.数据以二进制方式编码后才能存储在计算机中
B.大数据技术不能处理非结构化数据
C.同一数据经解释后产生的信息都是相同的
D.信息加工处理后不会产生更有价值的信息
答案 A
解析 本题考查数据、信息和二进制编码及大数据特征相关知识点。A选项计算机数据都是以二进制的方式进行存储;B选项大数据的特征之一是数据类型多,包含结构化数据、半结构化数据和非结构化数据,大数据技术能处理非结构化数据;C选项人们对相同的数据可以有不同的解释,可以获得不一样的信息;D选项信息经过加工处理后,可能产生更有价值的信息。
重难点1 数据、信息和知识的关系
数据是信息的载体,是看得见摸得着的具体事物,而信息是对数据的解释,是一种意义,往往是运用不同知识得到的解释结论。知识是公式、定理或经验的总结,可以利用知识解决实际生活中问题,综合运用多种知识解决同一问题,是智慧的体现。
例1 下列关于数据和信息的说法,正确的是(  )
A.在数据处理过程中不会有新的信息产生
B.信息的保存和传播可以不依附于载体
C.信息的价值因人而异,但信息不会有虚假
D.计算机中的数据表现形式不同,但都以二进制方式存储
思维点拨
明考向 本题考查数据和信息的基本概念
精 点 拨 A 处理数据的同时产生新的数据
B 信息有载体依附性
C 信息有真伪性
D 计算机的部件只能处理二进制信息
答案 D
变式1 下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体,只要有足够的数据,就获得了足够的信息
B.在数据处理的过程中,可能产生新的数据和信息
C.数据必须经过数字化,才能被加工处理
D.计算机中各种类型数据均采用二进制方式存储,且编码方式也相同
答案 B
解析 本题考查数据与信息的概念。A选项信息是对数据的解释,足够的数据不一定能解释得到全部的信息。B选项数据在使用过程会产生新数据。C选项数据也可以是现实生活中的模拟数据。D选项不同类型的数据在不同场合下编码不一定相同,如同一个汉字在GB2312和在Unicode中的编码是不一样的。
例2 下列关于数据和信息的说法,正确的是(  )
A.数据的表现形式只能是文字和图像
B.同一信息对所有人而言其价值是相同的
C.计算机中保存的数据可以是未经数字化的
D.信息是数据经分析、解释后得到的
思维点拨
明考向 本题考查数据和信息的相关概念
精 点 拨 A 数据是文字、图形、图像、声音、视频等符号表示
B 同一信息对于不同的人来说,价值可能不一样
C 计算机中只能存储和表示数字化信息
D 信息是对数据的解释
答案 D
变式2 去医院就诊时,出示电子医保电子凭证二维码进行挂号、结算等操作,如图所示。下列说法正确的是(  )
A.二维码是图形,不是数据
B.图中的“330***********9076”仅是数字,不具有意义
C.参保人的身份信息绑定在医保电子凭证中,这体现了信息的载体依附性
D.数据是数字经过储存、分析及解释后所产生的意义
答案 C
解析 本题考查数据和信息的相关知识。A选项图形是数据的一种表现形式。B选项对数据在具体环境下是有意义的。C选项数据是信息的载体,信息依附在数据中。D选项信息是对数据的解释后产生的意义。
重难点2 大数据
大数据的定义围绕数据体量巨大、速度快、种类繁多和价值密度低4个特性,可以从特性来看是否是大数据。大数据的思维体现在分析的是全体数据,而不是抽样数据;对于数据不再追求精确性,而是能够接受数据的混杂性;不一定强调对事物因果关系的探求,而是更加注重它们的相关性。大数据往往采用分治的思想进行处理,数据类型分别静态、流和图数据三种。
例1 下列关于数据和大数据的说法,正确的是(  )
A.数字和文字是数据常见的表现形式
B.未经数字化的数据不能被记录和传输
C.大数据蕴含着巨大的价值,价值密度很高
D.大数据为社会各层面带来便利,不存在任何安全隐患
思维点拨
明考向 本题考查数据和大数据的基本概念
精 点 拨 A 数据是数字、文字等符号表示
B 生活中数据可以用纸张等记录和传输
C 大数据蕴含着巨大的价值,但其价值密度低
D 大数据为社会各层面带来便利的同时,也可能存在安全隐患,如个人隐私泄露等
答案 A
变式1 在抗击疫情中,大数据技术发挥了重大作用,下列关于大数据的说法正确的是(  )
A.某校学生填写是否做过核酸的信息,由学校汇总后的数据属于大数据
B.基于大数据技术,个别数据不准确会影响数据分析
C.处理大数据的基本思想是并行处理的思想
D.在手机上填写个人资料后申领“健康码”的过程,涉及数据库技术
答案 D
解析 本题考查大数据的概念和特性。A选项学校汇总后的数据不满足大数据的4V特征。B选项大数据思维不追求数据精确性,允许混杂数据。C选项处理大数据的基本思想是分治处理。D选项填写的个人资料属于结构化数据,往往存储在数据库中。
例2 高德地图APP在导航服务中调用北斗卫星系统,其日定位请求次数超过3000亿次,使道路交通情况预测的准确度得到提高。下列说法正确的是(  )
A.高德地图APP数据传输时不需要传输介质
B.根据交通路况实时更新导航路线采用批处理计算
C.用户在使用导航数据的同时自身也在产生数据
D.因导航中数据体量大,预测未来交通情况采取抽样数据分析
思维点拨
明考向 本题考查数据和大数据的基本概念
精 点 拨 A 数据必须依附载体
B 交通路况属于流数据,需要进行实时处理
C 数据具有共享性,数据在使用过程会产生新的数据
D 大数据是对全体数据进行处理,而不是抽样数据
答案 C
变式2 下列关于数据处理与应用的说法,正确的是(  )
A.大数据一般具有数据量大、处理速度慢、数据类型多、价值密度高的特征
B.所有的文本数据处理都依次经过数据分析、特征提取、分词和结果呈现四个步骤
C.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
D.在数据处理过程中,数据的质量不会影响数据分析的结果
答案 C
解析 本题考查大数据、数据处理的相关知识。A选项大数据特征是速度快,不仅是产生速度快,处理速度也快,同时价值密度低;B选项文本处理结果过程包括分词、特征提取、数据分析、结果呈现四个步骤;C选项数据可视化有助于数据的视觉表现。D选项数据本身的质量直接会影响到最后的分析结果。
重难点1 数据、信息和知识的关系
1.下列有关数据、信息的说法,正确的是(  )
A.一张光盘存储的图片不属于数据
B.计算机只能处理数字化后的数据
C.信息的表示、传播、存储不一定依附于某种载体
D.信息会因别人的获取而发生损耗
答案 B
解析 A选项图片是数据的表现形式,属于数据。C选项信息必须依附于载体。D选项信息具有共享性,不会发生损耗。
2.某高铁购票订单如图所示,下列说法正确的是(  )
A.该订单是信息
B.订单数据的表现形式只有数字
C.该车票是通过售票窗口购买的
D.“车票当日当次有效”体现了信息具有时效性
答案 D
解析 A选项该订单是数据。B选项订单数据上有文字等。C选项有订单号,是网上购买的。
3.下列关于数据、信息和知识的说法,不正确的是(  )
A.文字是数据的一种表现形式
B.信息超出有效期后不再具有任何价值
C.三角形(已知三条边的长度)的面积可以根据海伦公式计算得到,这是知识的体现
D.面对同样的信息,不同的人可能形成不同的知识
答案 B
解析 B选项过期的信息也可能具有价值。C选项是对知识的应用。
4.下列关于数据与信息的说法,不正确的是(  )
A.在计算机中,数据一般以文件的形式存储
B.存储信息的载体遭到破坏,其承载的信息会消失
C.由室内净化器测得的数据可以获得室内空气质量相关信息
D.预订车票时,余票的数量是数据,座位等级不是数据
答案 D
解析 A选项计算机中以文件形式存储数据。B选项信息具有载体依附性。C选项对数据解读形成信息。D选项座位等级也是数据。
5.下列有关数据、信息、知识的说法,正确的是(  )
A.一张光盘上存储的文件是信息
B.信息可以不依附于载体而存在
C.信息在传递的过程中,会因为被获取发生损耗
D.知识是人类在社会实践中所获得的认识和经验的总和
答案 D
解析 A选项光盘上文件是数据。B选项信息具有载体依附性。C选项信息在使用过程中不会发生损耗。
6.下列关于数据与信息的说法,正确的是(  )
A.不同来源的数据表达的意义可能相同
B.信息在共享时会发生损耗导致历史文献失传
C.信息可以被处理、分析,但数据不能
D.从历史数据中获取的信息不具备价值
答案 A
解析 B选项历史文献失传是因为载体被破坏,信息共享也不会发生损耗;C选项人们可以处理分析数据从而寻找其中规律;D选项信息的价值是相对的,历史数据包含的信息也可能有相应的价值。
重难点2 大数据
1.下列关于数据与大数据的说法,正确的是(  )
A.经过数字化的数据才能被计算机存储和处理
B.大数据的数据分析常采用抽样数据的方法
C.大数据价值密度的高低与数据总量的大小成正比
D.同一数据不可以依附于不同载体
答案 A
解析 B选项大数据是对全体数据进行分析。C选项大数据价值密度低,价值密度与数据总量不成比例。D选项同一数据被加工处理,可用不同的载体来表示。
2.下列关于数据、信息和大数据的说法,不正确的是(  )
A.信息的存储必须依附于某种载体
B.在当今社会,计算机已成为数据处理的主要工具
C.信息是数据经过储存、分析及解释后所产生的意义
D.大数据的特征包括数据体量大、速度快、数据类型多、价值密度高
答案 D
解析 D选项大数据价值密度低。
3.下列关于数据、信息和知识及大数据的说法正确的是(  )
A.信息对于不同的人群其价值是相同的
B.大数据改变的不仅是数据,还有人们的思维,大数据强调对事物因果关系的探求
C.大数据给生活带来便利的同时,也带来如信息泄露等安全问题
D.知识的获得是人利用自身已有的知识对信息进行加工重构得到新知,知识就是对信息的积累
答案 C
解析 A选项信息对于不同人解读不一样,价值也不一样。B选项大数据不强调因果关系。
4.下列关于大数据的说法,正确的是(  )
A.大数据指数据庞大、产生速度快、价值密度高的数据
B.处理大数据强调对事物因果关系的探求
C.一般采用分治思想处理大数据
D.道路交通大数据仅采用批处理方法
答案 C
解析 D选项交通大数据还包含大量正在产生的流数据。
5.用某APP扫描共享单车上的二维码就能解锁,骑行后在指定区域上锁并听到类似“还车成功”的提示音即可完成一次租借。用户信息、租车时间等信息均储存于二维表结构中。下列关于数据、大数据的说法不正确的是(  )
A.每次租借共享单车的记录是数据
B.用户的共享单车租借数据属于结构化数据
C.大数据因为体量太大,只需抽取部分数据进行分析
D.通过大数据分析可以优化共享单车的放置地点和数量
答案 C
解析 本题考查数据、大数据。C选项大数据要分析的是全体数据,而不是抽样数据。
6.下列关于大数据处理的说法,正确的是(  )
A.jieba模块是基于规则的分词方法的典型应用
B.典型的文本处理过程顺序为:数据分析→分词→特征提取→结果呈现
C.社交关系数据一般采用流计算模式进行处理
D.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
答案 D
解析 A选项jieba模块是基于字典的分词。B选项文本处理过程顺序为:分词→特征提取→数据分析→结果呈现。
重难点1 数据、信息和知识的关系
1.下列关于数据和信息的说法,正确的是(  )
A.通过无线传输的信息可以不依附于载体
B.同一信息对所有人而言价值是相同的
C.数据是信息经过分析、解释后得到的
D.计算机可以存储数字化后的数据
答案 D
解析 A选项信息具有载体依附性。B选项不同的人对同一信息的价值是不一样的。C选项信息是数据分析解释后得到的。D选项计算机只能存储二进制的数字化信息。
2.下列关于数据与信息的说法,正确的是(  )
A.虚假的数据不能承载任何信息
B.同一信息只能依附于同一种载体
C.信息是数据经过储存、分析及解释后所产生的意义
D.信息被更多的人获取,损耗就会越多
答案 C
解析 A选项信息必须有载体依附性。B选项信息可以被加工,转移到其他载体中。D选项信息可以共享,不会损耗。
3.下列关于数据和信息的说法,不正确的是(  )
A.结绳记事采用“大事大结,小事小结”,其中的绳结是数据
B.飞机票中的登机时间是数据
C.通过网络发布杭州亚运会金牌榜的信息无需载体
D.信息是数据经过储存、分析及解释后所产生的意义
答案 C
解析 A、B选项数据是文字、数字等符号表示。C选项信息具有载体依附性。
4.下列关于数据、信息与知识的说法,不正确的是(  )
A.单独的一个数字在没有上下文的情况下没有意义
B.信息通过人的理解和经验补充后,可以转化为知识
C.计算机只能处理经过数字化后的数据
D.数据古代就有,但信息是计算机出现以后才有的
答案 D
解析 A选项数据必须在一定的情景下才有意义。D选项信息是数据的解释,因此在古代就有信息。
5.下列关于数据和信息的说法,正确的是(  )
A.数据在传输过程中丢失,那么其承载的信息也会消失
B.同一信息可以依附于不同载体,但该信息对不同的人有相同的价值
C.信息可以被加工处理,加工后信息的价值一定更高
D.数字化指的是将不连续的模拟信号转换为连续的数字信号的过程
答案 A
解析 A选项信息依附于载体而存在,载体损坏信息也会丢失;B选项同一信息对于不同人的价值是不同的;C选项信息被加工处理后,其价值不一定更高;D选项数字化是指连续的模拟信号转换为数字信号的过程。
6.下列关于数据和信息的说法,正确的是(  )
A.经加工处理后的假消息价值较低
B.人类对于数据的利用不信赖于载体
C.残缺的竹简无法还原历史文献,说明了载体依附性
D.用微信扫码支付时二维码在一定时间内自动更新,体现了信息的共享性
答案 C
解析 A选项加工处理后的价值可能会更高。B选项人类对于数据的利用在一定程度上依赖于载体,如造纸术的发明,使得数据的记录与传输变得便捷高效。C选项竹简残缺信息就无法承载。D选项体现了信息的时效性。
7.下列有关数据和信息的说法,正确的是(  )
A.计算机中的数据以二进制的形式存储
B.人们观看在线影视时,点播的视频是信息
C.信息本身会因为被别人获取而发生损耗
D.计算机是数据处理的唯一工具
答案 A
解析 B选项视频是数据。
8.下列关于数据和信息的说法,不正确的是(  )
A.计算机中存储的数据是可以未经数字化的
B.同一信息对于不同人群的价值可能是不一样的
C.信息是数据经过储存、分析及解释后所产生的意义
D.数据的表现形式可以是数字、文本、图像、视频等
答案 A
解析 本题考查数据和信息的相关知识。A选项计算机中存储的数据都是经数字化的。
9.下列关于数据、信息、知识与智慧的说法,正确的是(  )
A.同一个数据在不同的场景下其意义是一样的
B.人们可以直接使用搜索引擎获得海量知识
C.信息具有载体依附性,书籍中的文字就是信息
D.智慧是一种更高层次的综合能力,体现为一种卓越的判断力
答案 D
解析 A选项数据必须在相应的场景下才有意义。
10.下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体
B.相同的数据所承载的信息都是相同的
C.数据在处理过程中不会产生新的信息
D.只有虚假的数据,没有虚假的信息
答案 A
解析 B选项不同的数据在不同的情景下含义是不一样的。C选项数据在处理过程将产生新的数据,新的数据承载新的信息。
11.下列关于数据和信息的说法,正确的是(  )
A.数据都以数字符号进行表示
B.信息共享会降低其价值
C.信息的存储与传递需要依附载体
D.分析不同数据得到的信息一定是不同的
答案 C
解析 A选项数据还有文字、图像等符号表示。D选项信息是对数据的解释,不同的人,不同的数据有不同的解释。
12.下列关于数据、信息和知识的说法,正确的是(  )
A.数据的表现形式只有数字和文字
B.同一种信息的获取途径和方法可以不同
C.通过搜索引擎搜索出来的内容都是知识
D.信息的价值不会因为时间的变化而改变
答案 B
解析 B选项对数据的不同加工方式获取不同的信息。C选项搜索引擎搜索出来的内容都是数据。
13.小华家门口有条小河,他想知道小河的宽度,决定用勾股定理来求解。于是他在河岸边选取点A、点B、点C、点D,测得相关数据如图所示,最后求得小河宽度15m。
下列说法正确的是(  )
A.上述表述中的30是数据,数据就是数字,本身没有意义
B.∠CAD=30°表示直线AC与河岸线形成的夹角为30度,这是知识
C.勾股定理是数学家通过归纳、演绎等手段对信息进行挖掘后形成的知识
D.用勾股定理求小河宽度是智慧的体现
答案 C
解析 本题考查数据、信息、知识与智慧的相关知识。A选项数据30在具体的环境中表示角度是30度,是有意义的。B选项夹角为30度是对数据的解读,属于信息。C选项知识是经验的总结。D选项勾股定理求小河宽度是对知识的应用。
14.下列关于信息、知识和智慧的说法正确的是(  )
A.很多古代著作消逝于历史长河,说明信息共享会造成信息损耗
B.知识是人类在社会实践中所获得的认识和经验总和,可继承和传递
C.通过搜索引擎获得海量信息后,就获得了海量的知识
D.疫情期间,“发烧”就联想到得了“新冠”,这是智慧的体现
答案 B
解析 A选项著作消逝是由于载体的损坏,造成信息的丢失。C选项搜索引擎仅仅获得海量信息,知识认识和经验总和。D选项是知识的应用。
15.下列关于数据、信息和知识的说法,正确的是(  )
A.乘坐火车时不需要提供纸质火车票,说明信息可以不依附于载体
B.银联卡因失去磁性无法读取,这说明信息在重复使用中会产生损耗
C.数据以二进制或十六进制方式编码后,才能存储在计算机中
D.学生将老师整理的题目顺利解题,是运用已学知识的体现
答案 D
解析 A选项通过人脸识别入站,人脸数据是载体。B选项载体损坏了,信息就不存在了。C选项计算机只能存储二进制。
16.关于数据与信息的说法,正确的是(  )
A.信息会随着载体形式的变化而变化
B.数据就是指数字
C.计算机对各类信息进行加工处理,本质上都是通过计算完成的
D.信息的显性价值是通过数据的加工处理而获得的
答案 C
解析 A选项信息具有传递性,在传递过程中,载体发生变化,但信息可能不会变。B选项数字是数据的一种。C选项计算机的本质是对数据的运算。D选项信息的隐性价值是通过数据的加工处理而获得的。
17.下列关于数据、信息与知识的说法,正确的是(  )
A.数据是信息经过储存、分析及解释后所产生的意义
B.人们可以在搜索引擎的帮助下获取海量的知识
C.名言“站在巨人肩膀上”说明信息可以继承和传递
D.“一百个人心中有一百个哈姆雷特”说明同样的信息可能建构不同的知识
答案 D
解析 A选项信息是数据经过储存、分析及解释后所产生的意义。B选项搜索引擎的帮助下获取海量的信息。C选项站在巨人肩膀上是经验的总结,属于知识。
18.下列有关信息、知识和智慧的理解不正确的是(  )
A.信息可以脱离它所反映的事物被存储、保存和传播
B.信息具有共享性,在传递过程中会产生损耗
C.知识是人类在社会实践中获得的认识与经验的总和,它可以继承和传递
D.智慧主要表现为收集、加工、应用、传递知识的能力以及对事物发展的前瞻性看法
答案 B
解析 A选项由于信息可以加工,因此可以脱离他反映的事物传播。B选项共享不会产生损耗。
重难点2 大数据
1.下列关于大数据的说法,正确的是(  )
A.大数据的数据体量巨大,价值密度高
B.处理大数据时,一般采用分治思想
C.大数据接受数据混杂,主要探求数据间的因果关系
D.大数据的应用,避免了用户隐私信息泄露的风险
答案 B
解析 A选项大数据价值密度低。C选项大数据讲究数据的相关性。D选项大数据的应用可能带来用户隐私信息泄露。
2.下列有关数据安全与大数据的说法,正确的是(  )
A.大数据的数据类型多、数据处理速度快、价值密度高
B.大数据强调事物的因果关系,也注重数据之间的相关性
C.通过数据加密方法来提高数据的完整性
D.大数据带来便利的同时也会带来数据泄露、个人隐私等社会问题
答案 D
解析 C选项数据加密是提高数据的安全性。
3.下列关于大数据与大数据处理的说法,不正确的是(  )
A.大数据价值密度低,“提纯”大数据可以让其发挥更大的价值
B.高速公路中实时产生的车流量数据属于静态数据
C.词频统计是文本数据处理中特征提取的一种方法
D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据
答案 B
解析 高速公路中实时产生的车流量数据是不间断地、持续到达的,属于流数据。
4.下列关于大数据及数据处理的说法,不正确的是(  )
A.不同时刻产生的重复数据可直接删除以节省存储空间
B.处理大数据时一般采用分治思想
C.大数据要分析的是全体数据,能接受数据的混杂性
D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等
答案 A
解析 A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。
5.下列有关大数据处理的说法,不正确的是(  )
A.处理大数据时,一般采用分治思想
B.对历史数据一般采用批处理方式
C.大数据处理时要求所有的数据都准确
D.大数据分析的是全体数据,而不是抽样数据
答案 C
解析 C选项大数据不再追求数据的精确性,当数据量大到一定程度时,个别数据的不准确不会影响结果。
6.关于大数据和大数据应用,下列说法不正确的是(  )
A.大数据追求数据的准确性,通过各种技术或人工手段来保证每个数据准确无误
B.基于用户购买行为的大数据,挖掘用户偏好,实现个性化推荐,属于大数据应用
C.大数据蕴含着巨大的价值,但是价值密度低
D.大数据更关注事物的相关性而不是因果关系
答案 A
解析 A选项大数据不追求数据的准确性。B选项数据挖掘是大数据应用之一。
7.下列关于数据与大数据的说法,正确的是(  )
A.数据是指所有能输入到计算机且只能被计算机程序处理的符号总称
B.大数据的数据类型多,价值密度低
C.我们可通过数据加密和数据解密来提高数据的保密性和完整性
D.大数据要分析的是抽样数据,而不是全体数据
答案 B
解析 本题考查大数据的基本性质。A选项数据并不要求只能被计算机处理。B选项符合大数据的基本特征。C选项加密不是数据的完整性。D选项大数据分析全体数据。
8.下列有关大数据与大数据处理的说法正确的是(  )
A.大数据可以采用抽样数据分析,目的是让处理速度更快
B.在大数据商品个性化推荐中,要分析人们购买商品的原因,从而提供精准推荐
C.文本数据处理一般先提取特征再进行分词、数据分析等处理
D.静态大数据的批处理可以和流数据的实时处理相整合,降低切换延时时间
答案 D
解析 本题考查大数据与大数据处理相关知识。选项A大数据要分析全体样本而不是抽样调查,即使为了加快处理速度也不应该抽样完成。选项B大数据要分析数据的相关性,而不是因果关系;大数据商品个性推荐中也是分析用户购买商品之间的关联性,而不是用户购买原因。选项C文本处理的一般步骤是分词、特征提取、数据分析和结果呈现,没有分词前不能提取特征。
9.下列关于大数据和人工智能的说法,正确的是(  )
A.用户在不同的时间登录同一个APP,其首页内容都不相同,是因为根据行为大数据做了精准推荐
B.某地图软件需要实时统计道路数据,发布车流﹑拥堵等信息,处理这些数据可用批处理计算
C.人工智能技术的发展改变人类生活﹑促进经济发展,可以解决所有问题
D.深度学习是以数据驱动的人工智能方法,但其仍需要事先构造知识库
答案 A
解析 B选项实时道路数据是流数据,批处理计算处理的是静态数据。D选项以数据驱动的人工智能方法不需要事先手工构造知识库。
10.下列关于大数据和大数据处理的说法,正确的是(  )
A.某校高二年级学生的学籍信息属于大数据
B.大数据时代,我们更强调事物因果关系的探求,而不是数据间的相关性
C.对于购物网站的广告推荐,一般采用批处理计算方式实现
D.某购物平台2023年“双11”的交易数据属于静态数据
答案 D
解析 D选项2023年“双11”的交易数据已经过去了,属于静态数据。
11.下列关于大数据的说法,正确的是(  )
A.大数据强调对事物因果关系的探求,不注重它们的相关性
B.大数据是指无法在可接受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
C.大数据其实就是海量的数据,在大数据时代,少量的数据没有什么价值
D.道路的监控每天都在记录海量的数据,但发生交通事故之后往往只用到几十秒,甚至是几秒钟的数据,这反映了大数据的低价值性
答案 B
解析 C选项少量的数据也可能是关键数据。
12.下列有关大数据的典型应用,说法错误的是(  )
A.大数据经过合适的处理方式,能获得更高的数据价值
B.在金融行业利用大数据,可以评估用户信用等级
C.保险行业可利用大数据进行欺诈行为分析和精细化运营
D.大数据的应用只能让我们了解事物的现状,不能预测未来
答案 D
解析 大数据可以分析和推断,预测未来。(共65张PPT)
第一部分 信息与信息系统
专题1 数据与大数据
1.掌握数据的定义和表现形式;
2.掌握信息的定义以及信息是对数据解释的功能;
3.掌握知识、信息和智慧的关系;
4.掌握大数据定义和性质;
5.掌握大数据的思维及处理.
目 录
CONTENTS
体系构建
01
真题再现
02
考点精练
03
当堂检测
04
课后练习
05
体系构建
1
数据改变了人类生活,各种技术的发展依赖于数据。解释数据中包含的意义,形成信息。对同一类信息进行分析、综合,抽象出相关特性,形成知识。在实际生产生活中,采用不同的决策,灵活应用各类知识,体现人们的智慧。加工信息的过程,采用了各种处理信息的技术,因此信息技术改变着人类的生存方式。人类在各种软硬件设施支撑下,对各种数据进行信息加工,并通过通信网络进行交流,把信息技术运用到生活中,形成各种信息系统。随着传感技术和计算机技术的发展,能快速地获取和处理各种类型的大量数据,大数据技术不仅能处理结构化数据,还能处理非结构化数据,并获取大数据带来的价值。
真题再现
2
(2024年1月浙江省选考)下列关于数据与信息的说法,正确的是(  )
A.数据以二进制方式编码后才能存储在计算机中
B.大数据技术不能处理非结构化数据
C.同一数据经解释后产生的信息都是相同的
D.信息加工处理后不会产生更有价值的信息
解析 本题考查数据、信息和二进制编码及大数据特征相关知识点。A选项计算机数据都是以二进制的方式进行存储;B选项大数据的特征之一是数据类型多,包含结构化数据、半结构化数据和非结构化数据,大数据技术能处理非结构化数据;C选项人们对相同的数据可以有不同的解释,可以获得不一样的信息;D选项信息经过加工处理后,可能产生更有价值的信息。
A
考点精练
3
重难点1 数据、信息和知识的关系
数据是信息的载体,是看得见摸得着的具体事物,而信息是对数据的解释,是一种意义,往往是运用不同知识得到的解释结论。知识是公式、定理或经验的总结,可以利用知识解决实际生活中问题,综合运用多种知识解决同一问题,是智慧的体现。
D
思维点拨
明考向 本题考查数据和信息的基本概念
精点拨 A 处理数据的同时产生新的数据
B 信息有载体依附性
C 信息有真伪性
D 计算机的部件只能处理二进制信息
例1 下列关于数据和信息的说法,正确的是(  )
A.在数据处理过程中不会有新的信息产生
B.信息的保存和传播可以不依附于载体
C.信息的价值因人而异,但信息不会有虚假
D.计算机中的数据表现形式不同,但都以二进制方式存储
变式1 下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体,只要有足够的数据,就获得了足够的信息
B.在数据处理的过程中,可能产生新的数据和信息
C.数据必须经过数字化,才能被加工处理
D.计算机中各种类型数据均采用二进制方式存储,且编码方式也相同
B
解析 本题考查数据与信息的概念。A选项信息是对数据的解释,足够的数据不一定能解释得到全部的信息。B选项数据在使用过程会产生新数据。C选项数据也可以是现实生活中的模拟数据。D选项不同类型的数据在不同场合下编码不一定相同,如同一个汉字在GB2312和在Unicode中的编码是不一样的。
例2 下列关于数据和信息的说法,正确的是(  )
A.数据的表现形式只能是文字和图像
B.同一信息对所有人而言其价值是相同的
C.计算机中保存的数据可以是未经数字化的
D.信息是数据经分析、解释后得到的
D
思维点拨
明考向 本题考查数据和信息的相关概念
精 点 拨 A 数据是文字、图形、图像、声音、视频等符号表示
B 同一信息对于不同的人来说,价值可能不一样
C 计算机中只能存储和表示数字化信息
D 信息是对数据的解释
变式2 去医院就诊时,出示电子医保电子凭证二维码进行挂号、结算等操作,如图所示。下列说法正确的是(  )
C
A.二维码是图形,不是数据
B.图中的“330***********9076”
仅是数字,不具有意义
C.参保人的身份信息绑定在医保
电子凭证中,这体现了信息的载体依附性
D.数据是数字经过储存、分析及解释后所产生的意义
解析 本题考查数据和信息的相关知识。A选项图形是数据的一种表现形式。B选项对数据在具体环境下是有意义的。C选项数据是信息的载体,信息依附在数据中。D选项信息是对数据的解释后产生的意义。
重难点2 大数据
大数据的定义围绕数据体量巨大、速度快、种类繁多和价值密度低4个特性,可以从特性来看是否是大数据。大数据的思维体现在分析的是全体数据,而不是抽样数据;对于数据不再追求精确性,而是能够接受数据的混杂性;不一定强调对事物因果关系的探求,而是更加注重它们的相关性。大数据往往采用分治的思想进行处理,数据类型分别静态、流和图数据三种。
例1 下列关于数据和大数据的说法,正确的是(  )
A.数字和文字是数据常见的表现形式
B.未经数字化的数据不能被记录和传输
C.大数据蕴含着巨大的价值,价值密度很高
D.大数据为社会各层面带来便利,不存在任何安全隐患
A
思维点拨
明考向 本题考查数据和大数据的基本概念
精 点 拨 A 数据是数字、文字等符号表示
B 生活中数据可以用纸张等记录和传输
C 大数据蕴含着巨大的价值,但其价值密度低
D 大数据为社会各层面带来便利的同时,也可能存在安全隐患,如个人隐私泄露等
变式1 在抗击疫情中,大数据技术发挥了重大作用,下列关于大数据的说法正确的是(  )
A.某校学生填写是否做过核酸的信息,由学校汇总后的数据属于大数据
B.基于大数据技术,个别数据不准确会影响数据分析
C.处理大数据的基本思想是并行处理的思想
D.在手机上填写个人资料后申领“健康码”的过程,涉及数据库技术
D
解析 本题考查大数据的概念和特性。A选项学校汇总后的数据不满足大数据的4V特征。B选项大数据思维不追求数据精确性,允许混杂数据。C选项处理大数据的基本思想是分治处理。D选项填写的个人资料属于结构化数据,往往存储在数据库中。
例2 高德地图APP在导航服务中调用北斗卫星系统,其日定位请求次数超过3000亿次,使道路交通情况预测的准确度得到提高。下列说法正确的是(  )
A.高德地图APP数据传输时不需要传输介质
B.根据交通路况实时更新导航路线采用批处理计算
C.用户在使用导航数据的同时自身也在产生数据
D.因导航中数据体量大,预测未来交通情况采取抽样数据分析
C
思维点拨
明考向 本题考查数据和大数据的基本概念
精 点 拨 A 数据必须依附载体
B 交通路况属于流数据,需要进行实时处理
C 数据具有共享性,数据在使用过程会产生新的数据
D 大数据是对全体数据进行处理,而不是抽样数据
变式2 下列关于数据处理与应用的说法,正确的是(  )
A.大数据一般具有数据量大、处理速度慢、数据类型多、价值密度高的特征
B.所有的文本数据处理都依次经过数据分析、特征提取、分词和结果呈现四个步骤
C.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
D.在数据处理过程中,数据的质量不会影响数据分析的结果
C
解析 本题考查大数据、数据处理的相关知识。A选项大数据特征是速度快,不仅是产生速度快,处理速度也快,同时价值密度低;B选项文本处理结果过程包括分词、特征提取、数据分析、结果呈现四个步骤;C选项数据可视化有助于数据的视觉表现。D选项数据本身的质量直接会影响到最后的分析结果。
当堂检测
4
重难点1 数据、信息和知识的关系
重难点2 大数据
1.下列有关数据、信息的说法,正确的是(  )
A.一张光盘存储的图片不属于数据
B.计算机只能处理数字化后的数据
C.信息的表示、传播、存储不一定依附于某种载体
D.信息会因别人的获取而发生损耗
B
解析 A选项图片是数据的表现形式,属于数据。C选项信息必须依附于载体。D选项信息具有共享性,不会发生损耗。
D
解析 A选项该订单是数据。B选项订单数据上有文字等。C选项有订单号,是网上购买的。
2.某高铁购票订单如图所示,下列说法正确的是(  )
A.该订单是信息
B.订单数据的表现形式只有数字
C.该车票是通过售票窗口购买的
D.“车票当日当次有效”体现了
信息具有时效性
B
解析 B选项过期的信息也可能具有价值。C选项是对知识的应用。
A.文字是数据的一种表现形式
B.信息超出有效期后不再具有任何价值
C.三角形(已知三条边的长度)的面积可以根据海伦公式计算得到,这是知识的体现
D.面对同样的信息,不同的人可能形成不同的知识
D
解析 A选项计算机中以文件形式存储数据。B选项信息具有载体依附性。C选项对数据解读形成信息。D选项座位等级也是数据。
4.下列关于数据与信息的说法,
A.在计算机中,数据一般以文件的形式存储
B.存储信息的载体遭到破坏,其承载的信息会消失
C.由室内净化器测得的数据可以获得室内空气质量相关信息
D.预订车票时,余票的数量是数据,座位等级不是数据
解析 A选项光盘上文件是数据。B选项信息具有载体依附性。C选项信息在使用过程中不会发生损耗。
5.下列有关数据、信息、知识的说法,正确的是(  )
A.一张光盘上存储的文件是信息
B.信息可以不依附于载体而存在
C.信息在传递的过程中,会因为被获取发生损耗
D.知识是人类在社会实践中所获得的认识和经验的总和
D
A
解析 B选项历史文献失传是因为载体被破坏,信息共享也不会发生损耗;C选项人们可以处理分析数据从而寻找其中规律;D选项信息的价值是相对的,历史数据包含的信息也可能有相应的价值。
6.下列关于数据与信息的说法,正确的是(  )
A.不同来源的数据表达的意义可能相同
B.信息在共享时会发生损耗导致历史文献失传
C.信息可以被处理、分析,但数据不能
D.从历史数据中获取的信息不具备价值
A
解析 B选项大数据是对全体数据进行分析。C选项大数据价值密度低,价值密度与数据总量不成比例。D选项同一数据被加工处理,可用不同的载体来表示。
1.下列关于数据与大数据的说法,正确的是(  )
A.经过数字化的数据才能被计算机存储和处理
B.大数据的数据分析常采用抽样数据的方法
C.大数据价值密度的高低与数据总量的大小成正比
D.同一数据不可以依附于不同载体
D
解析 D选项大数据价值密度低。
2.下列关于数据、信息和大数据的说法,
A.信息的存储必须依附于某种载体
B.在当今社会,计算机已成为数据处理的主要工具
C.信息是数据经过储存、分析及解释后所产生的意义
D.大数据的特征包括数据体量大、速度快、数据类型多、价值密度高
C
解析 A选项信息对于不同人解读不一样,价值也不一样。B选项大数据不强调因果关系。
3.下列关于数据、信息和知识及大数据的说法正确的是(  )
A.信息对于不同的人群其价值是相同的
B.大数据改变的不仅是数据,还有人们的思维,大数据强调对事物因果关系的探求
C.大数据给生活带来便利的同时,也带来如信息泄露等安全问题
D.知识的获得是人利用自身已有的知识对信息进行加工重构得到新知,知识就是对信息的积累
C
解析 D选项交通大数据还包含大量正在产生的流数据。
4.下列关于大数据的说法,正确的是(  )
A.大数据指数据庞大、产生速度快、价值密度高的数据
B.处理大数据强调对事物因果关系的探求
C.一般采用分治思想处理大数据
D.道路交通大数据仅采用批处理方法
C
解析 本题考查数据、大数据。C选项大数据要分析的是全体数据,而不是抽样数据。
5.用某APP扫描共享单车上的二维码就能解锁,骑行后在指定区域上锁并听到类似“还车成功”的提示音即可完成一次租借。用户信息、租车时间等信息均储存于二维表结构中。下列关于数据、大数据的说法
A.每次租借共享单车的记录是数据
B.用户的共享单车租借数据属于结构化数据
C.大数据因为体量太大,只需抽取部分数据进行分析
D.通过大数据分析可以优化共享单车的放置地点和数量
D
解析 A选项jieba模块是基于字典的分词。B选项文本处理过程顺序为:分词→特征提取→数据分析→结果呈现。
6.下列关于大数据处理的说法,正确的是(  )
A.jieba模块是基于规则的分词方法的典型应用
B.典型的文本处理过程顺序为:数据分析→分词→特征提取→结果呈现
C.社交关系数据一般采用流计算模式进行处理
D.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息
课后练习
5
重难点1 数据、信息和知识的关系
重难点2 大数据
1.下列关于数据和信息的说法,正确的是(  )
A.通过无线传输的信息可以不依附于载体
B.同一信息对所有人而言价值是相同的
C.数据是信息经过分析、解释后得到的
D.计算机可以存储数字化后的数据
D
解析 A选项信息具有载体依附性。B选项不同的人对同一信息的价值是不一样的。C选项信息是数据分析解释后得到的。D选项计算机只能存储二进制的数字化信息。
2.下列关于数据与信息的说法,正确的是(  )
A.虚假的数据不能承载任何信息
B.同一信息只能依附于同一种载体
C.信息是数据经过储存、分析及解释后所产生的意义
D.信息被更多的人获取,损耗就会越多
C
解析 A选项信息必须有载体依附性。B选项信息可以被加工,转移到其他载体中。D选项信息可以共享,不会损耗。
3.下列关于数据和信息的说法,
A.结绳记事采用“大事大结,小事小结”,其中的绳结是数据
B.飞机票中的登机时间是数据
C.通过网络发布杭州亚运会金牌榜的信息无需载体
D.信息是数据经过储存、分析及解释后所产生的意义
C
解析 A、B选项数据是文字、数字等符号表示。C选项信息具有载体依附性。
4.下列关于数据、信息与知识的说法,
A.单独的一个数字在没有上下文的情况下没有意义
B.信息通过人的理解和经验补充后,可以转化为知识
C.计算机只能处理经过数字化后的数据
D.数据古代就有,但信息是计算机出现以后才有的
D
解析 A选项数据必须在一定的情景下才有意义。D选项信息是数据的解释,因此在古代就有信息。
A
解析 A选项信息依附于载体而存在,载体损坏信息也会丢失;B选项同一信息对于不同人的价值是不同的;C选项信息被加工处理后,其价值不一定更高;D选项数字化是指连续的模拟信号转换为数字信号的过程。
5.下列关于数据和信息的说法,正确的是(  )
A.数据在传输过程中丢失,那么其承载的信息也会消失
B.同一信息可以依附于不同载体,但该信息对不同的人有相同的价值
C.信息可以被加工处理,加工后信息的价值一定更高
D.数字化指的是将不连续的模拟信号转换为连续的数字信号的过程
6.下列关于数据和信息的说法,正确的是(  )
A.经加工处理后的假消息价值较低
B.人类对于数据的利用不信赖于载体
C.残缺的竹简无法还原历史文献,说明了载体依附性
D.用微信扫码支付时二维码在一定时间内自动更新,体现了信息的共享性
C
解析 A选项加工处理后的价值可能会更高。B选项人类对于数据的利用在一定程度上依赖于载体,如造纸术的发明,使得数据的记录与传输变得便捷高效。C选项竹简残缺信息就无法承载。D选项体现了信息的时效性。
7.下列有关数据和信息的说法,正确的是(  )
A.计算机中的数据以二进制的形式存储
B.人们观看在线影视时,点播的视频是信息
C.信息本身会因为被别人获取而发生损耗
D.计算机是数据处理的唯一工具
A
解析 B选项视频是数据。
A
解析 本题考查数据和信息的相关知识。A选项计算机中存储的数据都是经数字化的。
8.下列关于数据和信息的说法,
A.计算机中存储的数据是可以未经数字化的
B.同一信息对于不同人群的价值可能是不一样的
C.信息是数据经过储存、分析及解释后所产生的意义
D.数据的表现形式可以是数字、文本、图像、视频等
9.下列关于数据、信息、知识与智慧的说法,正确的是(  )
A.同一个数据在不同的场景下其意义是一样的
B.人们可以直接使用搜索引擎获得海量知识
C.信息具有载体依附性,书籍中的文字就是信息
D.智慧是一种更高层次的综合能力,体现为一种卓越的判断力
D
解析 A选项数据必须在相应的场景下才有意义。
10.下列关于数据和信息的说法,正确的是(  )
A.数据是信息的载体
B.相同的数据所承载的信息都是相同的
C.数据在处理过程中不会产生新的信息
D.只有虚假的数据,没有虚假的信息
A
解析 B选项不同的数据在不同的情景下含义是不一样的。C选项数据在处理过程将产生新的数据,新的数据承载新的信息。
11.下列关于数据和信息的说法,正确的是(  )
A.数据都以数字符号进行表示
B.信息共享会降低其价值
C.信息的存储与传递需要依附载体
D.分析不同数据得到的信息一定是不同的
C
解析 A选项数据还有文字、图像等符号表示。D选项信息是对数据的解释,不同的人,不同的数据有不同的解释。
12.下列关于数据、信息和知识的说法,正确的是(  )
A.数据的表现形式只有数字和文字
B.同一种信息的获取途径和方法可以不同
C.通过搜索引擎搜索出来的内容都是知识
D.信息的价值不会因为时间的变化而改变
B
解析 B选项对数据的不同加工方式获取不同的信息。C选项搜索引擎搜索出来的内容都是数据。
13.小华家门口有条小河,他想知道小河的宽度,决定用勾股定理来求解。于是他在河岸边选取点A、点B、点C、点D,测得相关数据如图所示,最后求得小河宽度15m。下列说法正确的是(  )
C
A.上述表述中的30是数据,数据就是数字,本身没有意义
B.∠CAD=30°表示直线AC与河岸线形成的夹角为30度,这是知识
C.勾股定理是数学家通过归纳、演绎等手段对信息进行挖掘后形成的知识
D.用勾股定理求小河宽度是智慧的体现
解析 本题考查数据、信息、知识与智慧的相关知识。A选项数据30在具体的环境中表示角度是30度,是有意义的。B选项夹角为30度是对数据的解读,属于信息。C选项知识是经验的总结。D选项勾股定理求小河宽度是对知识的应用。
14.下列关于信息、知识和智慧的说法正确的是(  )
A.很多古代著作消逝于历史长河,说明信息共享会造成信息损耗
B.知识是人类在社会实践中所获得的认识和经验总和,可继承和传递
C.通过搜索引擎获得海量信息后,就获得了海量的知识
D.疫情期间,“发烧”就联想到得了“新冠”,这是智慧的体现
B
解析 A选项著作消逝是由于载体的损坏,造成信息的丢失。C选项搜索引擎仅仅获得海量信息,知识认识和经验总和。D选项是知识的应用。
15.下列关于数据、信息和知识的说法,正确的是(  )
A.乘坐火车时不需要提供纸质火车票,说明信息可以不依附于载体
B.银联卡因失去磁性无法读取,这说明信息在重复使用中会产生损耗
C.数据以二进制或十六进制方式编码后,才能存储在计算机中
D.学生将老师整理的题目顺利解题,是运用已学知识的体现
D
解析 A选项通过人脸识别入站,人脸数据是载体。B选项载体损坏了,信息就不存在了。C选项计算机只能存储二进制。
16.关于数据与信息的说法,正确的是(  )
A.信息会随着载体形式的变化而变化
B.数据就是指数字
C.计算机对各类信息进行加工处理,本质上都是通过计算完成的
D.信息的显性价值是通过数据的加工处理而获得的
C
解析 A选项信息具有传递性,在传递过程中,载体发生变化,但信息可能不会变。B选项数字是数据的一种。C选项计算机的本质是对数据的运算。D选项信息的隐性价值是通过数据的加工处理而获得的。
17.下列关于数据、信息与知识的说法,正确的是(  )
A.数据是信息经过储存、分析及解释后所产生的意义
B.人们可以在搜索引擎的帮助下获取海量的知识
C.名言“站在巨人肩膀上”说明信息可以继承和传递
D.“一百个人心中有一百个哈姆雷特”说明同样的信息可能建构不同的知识
D
解析 A选项信息是数据经过储存、分析及解释后所产生的意义。B选项搜索引擎的帮助下获取海量的信息。C选项站在巨人肩膀上是经验的总结,属于知识。
18.下列有关信息、知识和智慧的理解
A.信息可以脱离它所反映的事物被存储、保存和传播
B.信息具有共享性,在传递过程中会产生损耗
C.知识是人类在社会实践中获得的认识与经验的总和,它可以继承和传递
D.智慧主要表现为收集、加工、应用、传递知识的能力以及对事物发展的前瞻性看法
B
解析 A选项由于信息可以加工,因此可以脱离他反映的事物传播。B选项共享不会产生损耗。
1.下列关于大数据的说法,正确的是(  )
A.大数据的数据体量巨大,价值密度高
B.处理大数据时,一般采用分治思想
C.大数据接受数据混杂,主要探求数据间的因果关系
D.大数据的应用,避免了用户隐私信息泄露的风险
B
解析 A选项大数据价值密度低。C选项大数据讲究数据的相关性。D选项大数据的应用可能带来用户隐私信息泄露。
D
解析 C选项数据加密是提高数据的安全性。
2.下列有关数据安全与大数据的说法,正确的是(  )
A.大数据的数据类型多、数据处理速度快、价值密度高
B.大数据强调事物的因果关系,也注重数据之间的相关性
C.通过数据加密方法来提高数据的完整性
D.大数据带来便利的同时也会带来数据泄露、个人隐私等社会问题
B
解析 高速公路中实时产生的车流量数据是不间断地、持续到达的,属于流数据。
3.下列关于大数据与大数据处理的说法,
A.大数据价值密度低,“提纯”大数据可以让其发挥更大的价值
B.高速公路中实时产生的车流量数据属于静态数据
C.词频统计是文本数据处理中特征提取的一种方法
D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据
A
解析 A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。
4.下列关于大数据及数据处理的说法,
A.不同时刻产生的重复数据可直接删除以节省存储空间
B.处理大数据时一般采用分治思想
C.大数据要分析的是全体数据,能接受数据的混杂性
D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等
C
解析 C选项大数据不再追求数据的精确性,当数据量大到一定程度时,个别数据的不准确不会影响结果。
5.下列有关大数据处理的说法,
A.处理大数据时,一般采用分治思想
B.对历史数据一般采用批处理方式
C.大数据处理时要求所有的数据都准确
D.大数据分析的是全体数据,而不是抽样数据
A
解析 A选项大数据不追求数据的准确性。B选项数据挖掘是大数据应用之一。
6.关于大数据和大数据应用,下列说法
A.大数据追求数据的准确性,通过各种技术或人工手段来保证每个数据准确无误
B.基于用户购买行为的大数据,挖掘用户偏好,实现个性化推荐,属于大数据应用
C.大数据蕴含着巨大的价值,但是价值密度低
D.大数据更关注事物的相关性而不是因果关系
B
解析 本题考查大数据的基本性质。A选项数据并不要求只能被计算机处理。B选项符合大数据的基本特征。C选项加密不是数据的完整性。D选项大数据分析全体数据。
7.下列关于数据与大数据的说法,正确的是(  )
A.数据是指所有能输入到计算机且只能被计算机程序处理的符号总称
B.大数据的数据类型多,价值密度低
C.我们可通过数据加密和数据解密来提高数据的保密性和完整性
D.大数据要分析的是抽样数据,而不是全体数据
8.下列关于数据与大数据的说法,正确的是(  )
A.数据是指所有能输入到计算机且只能被计算机程序处理的符号总称
B.大数据的数据类型多,价值密度低
C.我们可通过数据加密和数据解密来提高数据的保密性和完整性
D.大数据要分析的是抽样数据,而不是全体数据
解析 本题考查大数据与大数据处理相关知识。选项A大数据要分析全体样本而不是抽样调查,即使为了加快处理速度也不应该抽样完成。选项B大数据要分析数据的相关性,而不是因果关系;大数据商品个性推荐中也是分析用户购买商品之间的关联性,而不是用户购买原因。选项C文本处理的一般步骤是分词、特征提取、数据分析和结果呈现,没有分词前不能提取特征。
D
A
解析 B选项实时道路数据是流数据,批处理计算处理的是静态数据。D选项以数据驱动的人工智能方法不需要事先手工构造知识库。
9.下列关于大数据和人工智能的说法,正确的是(  )
A.用户在不同的时间登录同一个APP,其首页内容都不相同,是因为根据行为大数据做了精准推荐
B.某地图软件需要实时统计道路数据,发布车流﹑拥堵等信息,处理这些数据可用批处理计算
C.人工智能技术的发展改变人类生活﹑促进经济发展,可以解决所有问题
D.深度学习是以数据驱动的人工智能方法,但其仍需要事先构造知识库
D
解析 D选项2023年“双11”的交易数据已经过去了,属于静态数据。
10.下列关于大数据和大数据处理的说法,正确的是(  )
A.某校高二年级学生的学籍信息属于大数据
B.大数据时代,我们更强调事物因果关系的探求,而不是数据间的相关性
C.对于购物网站的广告推荐,一般采用批处理计算方式实现
D.某购物平台2023年“双11”的交易数据属于静态数据
B
解析 C选项少量的数据也可能是关键数据。
11.下列关于大数据的说法,正确的是(  )
A.大数据强调对事物因果关系的探求,不注重它们的相关性
B.大数据是指无法在可接受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
C.大数据其实就是海量的数据,在大数据时代,少量的数据没有什么价值
D.道路的监控每天都在记录海量的数据,但发生交通事故之后往往只用到几十秒,甚至是几秒钟的数据,这反映了大数据的低价值性
D
解析 大数据可以分析和推断,预测未来。
12.下列有关大数据的典型应用,说法
A.大数据经过合适的处理方式,能获得更高的数据价值
B.在金融行业利用大数据,可以评估用户信用等级
C.保险行业可利用大数据进行欺诈行为分析和精细化运营
D.大数据的应用只能让我们了解事物的现状,不能预测未来

展开更多......

收起↑

资源列表