资源简介 专题01 数据与信息【学习目标】理解数据与信息的概念及其发展历史:学生应能够描述数据和信息的区别,并了解从远古时代到现代,人类如何使用不同的工具和方法来记录、存储和处理数据。这包括对石器刻画图案、结绳记事法、文字与数字的出现、造纸术与印刷术的发明等关键历史节点的了解。掌握数据采集和数字化的基本概念:教学目标中需包含对数据采集方式的理解,如传感器的使用、互联网和物联网技术在数据采集中的应用,以及数字化过程,包括采样、量化和编码的基础知识。深入理解数据管理与安全的重要性及策略:学生需要了解数据管理的三个阶段(人工管理、文件管理、数据库管理),并探讨如何通过技术手段保护数据安全,包括数据备份、异地容灾和数据加密等方法。【思维导图】【知识梳理】知识点一:感知数据1.数据及其演变原始的石器刻画图案 结绳记事 文字与数字的出现 造纸术与印刷术的发明文字与数字的诞生:楔形文字记录了早期的交易数据,标志着数据记录的明确化。造纸与印刷:技术进步使数据记录与传播更加高效,至今仍在发挥重要作用。图像与声音记录:摄影术和留声机的发明,使图像和声音的保存变得便捷。2.数据及其演变2.现代数据处理与传输电子计算机:20世纪40年代诞生,成为数据处理的主要工具。互联网与大数据:加速了数据传输与处理,移动网络和传感器普及,大数据渗透生活。多样化数据记录形式:数据采集技术发展,数据形式多样化,影响生活习惯。3.数据与生活日常应用:购物清单、车票中的数据记录,互联网技术融入生活,如电子地图、移动支付、电子票据。数据可视化:股票走势图、迁徙图直观展现数据变化。互联网+经济形态:与传统行业深度融合,如“互联网+农业”,提升社会创新力和生产力。4.数据与科学科学证据:数据为科学研究提供客观证据,如天王星轨道偏差推算海王星。高精尖实验室:重视实验室建设,获取关键数据,如CERN的粒子物理学研究,推动科学进步。知识点二:数据、信息与知识1.数据数据是对客观事物的符号表示,单纯的数据是没有意义的数据的表现形式包括文字、图形、图像、音频和视频等,数字是最简单的表现形式。数据的载体是实物,包括书本等。2.信息信息是用来消除随机不确定性的东西。特征:(1)载体依附性:信息的表示、传播、存储必须依附于载体,而不是信息表示的事物。(2)时效性:信息反映的是某一特定时间内的状态,它会随时间的推移而变化。(3)共享性:信息是可以传递和共享的,可以被重复使用而不会产生损耗。(4)可加工处理性、真伪性:信息是可以加工和处理的。信息有真实信息和虚假信息之分。(5)价值性:信息的价值是相对的,包含显性价值和隐性价值。3.知识知识是人类在社会实践中获得的认识和经验的总和,也是人类在实践中认识客观世界的成果。知识是可以积累和传承的。4.智慧:全世界只有少部分人具有智慧高科技(航天、人工智能等)、对未来的预测、创造5.数据、信息与知识关系信息是数据经过储存、分析及解释后所产生的意义,信息的载体是数据通过归纳、演绎、比较等手段对信息进行挖掘,形成知识举例:数据:37.5;信息:小明的体温是37.5摄氏度;知识:正常人的体温在36.5-37.5之间知识点三:数据采集编码数据采集采集自然界数据:传感器(一般由敏感元件、转换元件、其他辅助元件组成)采集网络数据:网络爬虫进制转换(1)数据在计算机内部是以二进制方式进行存储和处理的。(2)常用的数制有:二进制(B)、十进制(D)、十六进制(H)。(3)各进制之间的转换规则如下:①二进制→十进制 按权展开相加法 例如:1001B=1*23+0*22+0*21+1*20=9D②十六进制→十进制 按权展开相加法 例如:3BH=3*161+11*160=59D③十进制→二进制 除2取余倒序法 例如:29D=11101B(算式如下图所示)④十进制→十六进制 除16取余倒序法 例如:49D=31H⑤二进制←→十六进制 8421分组转换法 例如:A9H=10101001B(从低位开始,以四位为一组)存储容量单位最小的存储容量单位:比特(bit)(b)基本的存储容量单位:字节(Byte)(B)1B=8b 1KB=1024B 1MB=1024KB 1GB=1024MB数字化(1)模拟信号和数字信号模拟信号是连续的数字信号是二进制,是离散的,不连续的将模拟信号转换为数字信号的过程称为数字化。声音信号通过传感器(麦克风)转化为模拟信号,模拟信号通过ADC模数转换器(声卡)转化为数字信号(2)数字化过程①采样:每隔一段时间采集样本,对横坐标时间轴划分②量化:将采集到的样本变为数值,对纵坐标划分③编码:编码是信息从一种形式按照某种规则或格式转换为另一种形式的过程。解码是编码的逆过程。常见的字符编码有ASCII、Unicode及各种汉字编码。ASCII码(美国信息交换标准码)基本的ASCII码共有128个对应的十六进制范围是00~7F,占1个字节。A:41H 65D a:61H 97D 0:30H 空格:20H 10:3130H汉字编码汉字编码分为外码、交换码、机内码和字形码。外码又叫输入码,包括拼音码、五笔字形码等(不唯一)交换码包括ASCII码、GB2312码(十六进制)不同的字符集有不同的表示方式,GB2312采用2个字节表示一个汉字。条形码我国普遍采用的EAN13条形码。每个编码都有意义声音文件存储容量:采样频率(Hz)*量化位数(位)*声道数*时长(秒)注意:立体声为2个声道;44.1kHz为44.1*1000Hz图像文件存储容量:总像素*位深度(位)注意:128级灰度是7位;256色是8位;RGB/8是24位视频文件存储容量:总像素*位深度*帧数总像素*位深度*帧频(fps)*时长PAL制式:25fps;NTSC制式:30fps知识点四:数据管理与安全数据管理(1)在大数据出现之前,计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段。Excel属于文件管理(2)在计算机中,数据一般以文件的形式存储。(3)传统数据库技术基于结构化数据进行开发,凭借其数据独立性、数据可共享等特点,已经成为现代社会数据管理的主要方式。数据库在安全性、易使用、可靠性等方面都取得了令人瞩目的成绩。(4)文件后缀名音频文件:.wav(无压缩) .mp3 .wma视频文件:.avi(无压缩) .mp4 .wmv .mpg图像文件:.bmp(无压缩) .jpg .gif .png文本文档:.txt 网页文件:.html 办公文档:.docx .xlsx .ppt数据安全(1)威胁数据安全的因素有很多,如存储介质损坏、操作失误、黑客入侵、计算机病毒、遭受自然灾害等,从而造成计算机数据被破坏。(2)通过保护存储数据的介质:磁盘阵列、异地容灾、数据备份(3)提高数据本身的安全:数据加密(保密性)、数据校验(完整性)。知识点五:数据与数据1.大数据的四个特征(1)数据体量巨大。(2)数据类型多。(3)价值密度低。(4)速度快。速度快不仅是指数据产生的速度快,还指数据处理速度快。2.大数据思维(1)大数据采用全体数据分析,而不是抽样数据。大数据时代仍旧存在抽样数据(2)大数据不再追求数据的精确性,能够接受数据的混杂性。(3)不一定强调事物之间的因果关系,更加注重它们的相关性。【题型精讲】例1 1用UltraEdit软件查看“2021高三加油!”的字符内码,部分界面如图所示。下列说法正确的是( )A.存储上述字符需要15个ByteB.字符在计算机内部的编码为16进制C."2"的ASCII编码为32H,则可以推算出字符"10"的编码为3AHD.字符"!"的编码为A1H【答案】BD【讲解】在UltraEdit软件中查看字符的内码,可以知道每个字符在计算机内部的编码为16进制。例如,"2021高三加油!"这句话中的每个字符都有其对应的16进制编码。对于A选项,存储上述字符需要15个Byte,这个信息无法从题目中直接得出,因为题目没有给出具体的字符数量或者每个字符占用的字节数。对于B选项,字符在计算机内部的编码为16进制,这是正确的。在计算机中,所有的数据都是以二进制的形式存储的,而16进制是一种常用的表示二进制的方式,因为它可以将每一位二进制数用一个十六进制的数来表示,这样可以使二进制数据的表示更加直观和容易处理。对于C选项,"2"的ASCII编码为32H,则可以推算出字符"10"的编码为3AH。这个说法是错误的。虽然"2"的ASCII编码是32H,但是我们不能直接推断出"10"的编码就是3AH。因为在ASCII编码表中,字符"10"实际上是由两个字符组成的:"1"和"0"。所以,我们需要分别找出这两个字符的ASCII编码,然后将它们拼接起来才能得到"10"的ASCII编码。对于D选项,字符"!"的编码为A1H。这个说法是正确的。在ASCII编码表中,字符"!"的编码确实是A1H。例2在数据管理与安全中,下列哪项不是保护数据安全的常见措施?A) 数据加密B) 数据备份C) 数据校验D) 随机存储介质损坏【答案】D【讲解】在文章1.4.2数据安全部分,提到了保护数据安全的措施包括磁盘阵列、数据备份、异地容灾等手段。选项A“数据加密”和选项B“数据备份”均是常见的数据安全保护措施。选项C“数据校验”也是确保数据完整性的一种方法。而选项D“随机存储介质损坏”实际上是一个不可预测的风险,不属于主动的数据安全保护措施,因此是不正确的选项。【强化训练】1.在大数据的概念中,"大数据之‘大’" 不仅指规模、速度和种类的特征,还意味着什么?A. 数据量小B. 数据处理能力强C. 超出以往软件的处理能力D. 不需要新的集成技术2.以下哪项不是大数据的特征?A. 数据体量巨大B. 处理速度快C. 数据类型单一D. 价值密度低3.在大数据时代,人们分析数据的方式有何不同?A. 仍然依赖于采样分析B. 只能分析全体数据中的部分信息C. 分析的是全体数据而不是抽样数据D. 更注重数据的精确性而非相关性4.请简述大数据的四个主要特征,并举例说明它们在现实生活中的应用。5.描述数字化过程中的关键步骤及其意义。6.阐述大数据对社会的影响,并给出具体例子。参考答案1.C【详解】“大数据之‘大’”不仅体现在数据的规模、速度和种类上,更重要的是,它超出了传统软件工具的处理能力,即C选项。这意味着需要采用新的处理技术和架构来应对大数据的挑战。2.C【详解】大数据的特征之一是种类多(Variety),即数据来源广泛且类型多样,包括结构化数据、半结构化数据和非结构化数据,因此C选项“数据类型单一”不是大数据的特征。3.C【详解】在大数据时代,分析方式从依赖于采样分析转向分析全体数据,即C选项。这是因为大数据技术能够处理和分析海量信息,而不仅仅是数据的子集,这样可以获得更全面的洞察。4.大数据的四个主要特征是:体量、速度、种类、价值。【详解】体量:指的是数据量的庞大,例如社交媒体每天产生的数据量,这要求有高效的大数据存储和处理能力。速度:指数据产生的速率快,如实时交易数据,需要实时或近实时的处理能力。种类:数据来源多样,包括文本、图像、视频等,需要复杂的数据处理技术。价值:虽然数据量大,但有价值的信息可能稀少,需要从海量数据中提取有价值的信息,如通过数据分析预测市场趋势。5.数字化过程中的关键步骤包括:数据采集、数据预处理、数据存储、数据分析、数据可视化。【详解】数据采集:收集来自各种源的原始数据,是数字化过程的起点,确保数据的完整性和准确性。数据预处理:清洗和转换数据,去除噪声和不一致性,为后续分析做准备。数据存储:使用高效的数据存储技术,如分布式文件系统,确保数据的可访问性和安全性。数据分析:应用统计学、机器学习等技术,从数据中提取知识和洞察。数据可视化:将分析结果以图表等形式展现,便于理解和决策。6.大数据对社会的影响包括提升决策的效率和准确性、优化业务流程、推动个性化服务、加强社会安全等。【详解】大数据对社会的影响广泛,例如:提升决策效率:政府和企业可以基于大数据分析做出更加科学的决策,如交通规划、疾病预测等。个性化服务:电商和社交媒体通过分析用户行为,提供个性化推荐,改善用户体验。优化业务流程:制造和物流行业利用大数据优化供应链管理,减少浪费,提高效率。加强社会安全:通过大数据分析,可以预测犯罪模式,提前采取措施,保护公共安全。具体例子:谷歌的流感趋势预测,通过分析用户搜索行为,提前几周预测流感爆发,为公共卫生部门提供决策支持。 展开更多...... 收起↑ 资源预览