资源简介 第一章知识点梳理姓名: 班级:【第一节:感知数据】数据及其演变:早在远古时代,为了记数,居住在洞穴中的原始人就用石器或骨器在 ,这些图案就是最原始的“数据”;后来,人们发明了 的方式来记事或记数;随着 ,数据以更加明确的形式被记录下来; ,使得数据的记录与传输变得便捷高效; 的发明使得保存真实的图像变得更加便捷;直到 世纪,爱迪生发明了 ,才得以将声音记录下来;20世纪40年代诞生了 ,成为了数据处理的主要工具; 的发展,加速了数据的传输与处理;随着移动网络与传感器的普及, 进入了人们生活的方方面面。数据与生活相比于生活中的传统数据,在互联网时代,人们生活中的数据形式也在发生改变, , , 等技术陆续融入生活。数据的 技术迅速发展,数据的 也越来越多样化,给人们的生活习惯带来了巨大的改变。人们在 的同时,自身的行为也在 。互联网加速了数据的 ,通过与传统行业的深度融合,发展成了一种新的社会经济形态—— ,给传统行业注入了活力。数据与科学科学研究离不开 。科学强调证据,而 正好为科学研究提供了可靠的依据。世界上最大的粒子物理学实验室: (简称: )。【第二节:数据、信息与知识】数据数据是对 ,如 等,其中数字是最简单的一种 ,但数据不等于 。在计算机科学中,数据是指 ,是用于 到计算机中进行处理,具有一定意义的 等的通称。数据的表现形式可以是 。单纯的数据是 的,因为数据的表现形式还不能完全表达其内容,经过解释,数据才变得有意义,数据和 是密不可分的。信息信息是指数据、 和 中所表达的 。信息是数据经过 、 及 后产生的意义。信息的特征:(1) :信息是不能独立存在的,必须 。如果存储信息的载体遭到破坏,那么其承载的信息就消失。同一信息也可以 ,因此人们获取信息的途径与方法也可以不同。但信息可以脱离 被存储和传播,这体现了信息的 性。(2)时效性:信息往往反映的是 ,他会随着时间的推移而变化,但超过时效的信息 (选填:一定/不一定)没有价值。(3) :信息是可以共享的,同一种信息可以同时被不同的接受者获取,人们也可以 。与 、 不同的是,信息 (选填:会/不会)因为被别人获取而发生损耗。(4) :信息是可以加工处理的,信息经过加工、处理、分析后,可以更好地被人们所使用。这一特征使信息具有 。(5) :信息的价值包括显性价值与隐形价值, 指的是信息内容本身具有价值,一般可被人们直接了解或体会; 指的是初信息内容外的价值,包括与信息紧密相关的所有价值。信息的价值也是 ,对于不同的人群、不同的时间,其价值可能有所不同。知识知识是 的总和,也是 的成果,它包括对 、 的描述以及在教育和实践中获得的技能。知识是可以 和 的。知识的获得,使人们利用自身已有的知识对信息进行 ,进而新的信息纳入自己的知识结构的过程。智慧智慧是一种更高层次的综合能力,主要表现为 、 、 、 的能力,以及对事物发展的 。它是在 的基础之上,通过认识的累积,而形成的对事物的认识、远见,体现为一种卓越的判断力。关系当人们孤立地看3.14时,它仅仅是一个 ;当人们在讨论圆的特性时,3.14是圆周率的近似值,这是 ;当人们用3.14乘以半径的平方来计算圆的面积时,这就是 ;当人们用圆的面积的计算公式求解圆形花坛所需草皮面积时,这是 。【第三节 数据采集与编码】数据采集在开展研究时,研究工作者往往需要收集大量的数据。早期一般是通过观察、实验等 得到数据,并将其记录下来,数据量较小时,可以用 进行处理。现在,互联网、物联网的发展使得数据的获取方式变多、获取速度变快。传感器随时获取来自 的数据(传感器是一种能 的器件或装置,通常由 和 组成),网络 可在短时间内获取大量 数据(网络爬虫是一种按照一定规则, 的程序或脚本)。数字化信息可以用 和 表达。以连续变化的物理量存在,大部分存在于 。数字信号在取值上是 、 的信号,在信息技术中,这种信号表示的数据是指可被计算机存储、处理的 数据。模拟信号与数字信号可相互转换,如将语音通过计算机的麦克风、声卡等设备存储在计算机中,这一过程实现了 转换为 ,简称 ;反之则是 ,其中用到的主要设备是 转换器(ADC)。数字化指的就是将 转换成 的过程。从某种意义上说,是信息社会的技术基础。将模拟信号转换成数字信号一般需要经过 、 和 。采样:采样是将信号从 的模拟信号转换到 的离散信号的过程。对于同一模拟信号,采样的 越小,采集到的信号样本数量越多。叫作采样频率,单位用 ( )表示,在相同的时间内,采样频率越好,采集的样本数量 。量化:在数字信号处理领域,量化指将信号的 近似为有限个 的过程。就是将采样到的信号用 表示出来,即将模拟信号的波形转换为数字,量化的过程是先将整个幅度划分成 的集合,把落入某个范围内的样值 ,并赋予相同的 。连续信号经过 成为离散信号,离散信号经过 后可用数值表示。数制(1)基本信息进制 二进制 十进制 十六进制进位规则基本数码位权(权值)进制表示请在下列括号中填写合适的标识符使等式成立:1( )+1( )=2( ) 1( )+1( )=2( )1( )+1( )=10( ) 9( )+1( )=10( )9( )+1( )=A( ) F( )+1( )=10( )(2)相互转换二进制→十进制:按权展开再相加(X进制→十进制:按权展开再相加)十进制→二进制:除二取余倒记(十进制→X进制:除X取余倒记)二进制与十六进制之间的转换(8421法)字符编码(1)存储容量单位计算机中存储容量的最小单位是 ( ) , 二进制数码表示 个bit,但由于1bit所能表示的值太小,实际上计算机中以 个bit为一个基本单位,即 ( )常见的单位还有KB,MB,GB等,他们的换算关系如下:ASCII码ASCII(American Standard Code for Information Interchange, )是一套基于拉丁字母的计算机编码系统,主要用于显示 和其他西欧语言。ASCII码共有 个,占 字节,利用1个字节的后 位表示,共有种编码,二进制编码范围为 ~ ,其中数字“0”的十进制编码为 ,大写字母“A”的十进制编码为 ,小写字母“a”的十进制编码为 。大小写字母之间的十进制编码差值为 ,十六进制差值为 。(3)汉字编码汉字编码:分为 四种。其中,外码也叫 ,是用来将汉字 到计算机的一组键盘符号,形式 (选填:唯一/不唯一);GB2312属于 码,又称 码,它用 字节表示一个汉字;机内码又称 码,在计算机内部汉字代码都用 ;字形码则是用于汉字的 。(4)内码查看为了便于查看,使用ultraedit软件看到的内码用 进制表示,查看内码时需要先进行划线分组,划线规则是: ,如图,字符“牛”对应的内码是 ,字符“1”对应的内码为 ,根据字符规则可以推算,字符“10”的内码为 。多媒体编码(1)条形码条形码(barcode)是将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的 ,条形码技术最早产生于 。我国普遍采用的是 条形码。这种条形码由 位数字组成,前3位数字表示国家代码,其中“690”表示 ,最后一位叫 ,用来检查扫描到的数字是否有错误,这个数字由前12位数字按一定规律计算得到。(2)二维码二维条码/二维码(2-dimensional bar code)是用某种特定的几何图形按照一定规律在平面上(二维方向)分布的 详见的图形记录数据符号信息,二维码在为人们的生活提供便利的同时,也带来了一定的安全隐患,不随意扫描 或安装 ,是信息社会的基本常识。(3)声音编码声音的频率一般以 表示,记为 ,指每秒周期性振动的次数,人耳可以感知到的声音频率范围为 ~ , 是用来表示声音强度的单位,记为dB。将模拟声音数字化需要经过 、 和 三个过程。常见的声音文件类型有 (不压缩)、 (有损压缩)、 (微软自带)。(4)图像编码组成 文件大小相对 放大效果 常见格式位图矢量图常见的位图图像文件格式: (不压缩,容量大), (有损压缩,容量相对小), (背景可透明,可静态可动态), (背景可透明)。色位关系: ,例如:黑白2色= 位,16色= 位,256色= 位,RGB颜色模式= 位。(5)视频编码视频是由静态图像 形成的。彩色电视制式,PAL制式 帧/秒,即每秒播放 帧图像,NTSC制式 帧/秒,即每秒播放 帧图像。(6)数据压缩由于数据量大,不便于存储与传输,往往需要对其进行压缩,压缩分为 压缩和无损压缩:无损压缩指的是压缩后的文件可完全还原,如常见的压缩(打包)软件rar格式,zip格式都属于无损压缩; 指的是压缩后的文件无法完全还原,如声音的压缩格式 ,图像的压缩格式 ,视频的压缩格式 ,都属于有损压缩。压缩比= : ,因此,压缩比一定比1 (选填:大/小)【第四节 数据管理与安全】数据管理数据管理是利用计算机硬件和软件技术对数据进行有效 、 、 和的过程,其目的在于 。计算机数据的管理已经经历了 、 和 三个阶段。在人们日常使用的计算机中,数据一般以 的形式存储。根据编码规则的不同,文件格式也不同,用以区分不同类型的存储数据,在windows操作系统中,用 来表示某些特定的文件类型。常见文件格式对应扩展名如下表:计算机一般采用 结构来管理文件,在windows系统中,则采用了更为形象的 来管理文件。每个应用程序都有自己的数据文件,数据可能在多个文件中重复出现,造成 。同时数据文件之间的相互关联,需要大量的人工干预,给数据的 和 造成不便,这些问题直到 的出现才得以解决。传统数据库技术基于 数据开发,凭借其数据 、 等特点,已经成为现代社会数据管理的主要方式。随着数据采集技术的提高,数据量急剧增长,大量 、 数据被源源不断地采集起来,对于这些数据,已经很难用传统的 进行管理。现在,借助 、 等技术,数据管理水平正不断提高。分类 数据特点 常见文件结构化数据非结构化数据半结构化数据数据安全威胁数据安全的因素有很多,如 、 、 、、 等,都有可能造成计算机中数据的损坏。保护数据安全需要保护 。主要采用主动防护的手段,如 、数据备份、 等手段,保证数据的安全。对于数据安全,不仅仅要做好防护上的安全,还应提高 ,如通过数据加密、 等方法来提高数据的 和完整性。 ,指通过加密算法和加密密钥将明文变成 ,而解密则是通过 将密文变成明文。数据校验,是为保证数据的 进行的一种验证操作,常见的数据校验方法有 、 、 等。【第五节 数据与大数据】大数据的概念大数据代表着 的信息资产,需要特定的技术和分析方法将其转换为价值。大数据的本质是 。大数据的特征① 。即 (Volume),大数据收集和分析的数据量非常大,现在传感器、互联网、智能终端等每天都在源源不断地产生海量数据。② 。即 (Velocity),有两种含义,一是指 。二是指 ,在信息社会中,数据往往 变化,数据的价值也会随着时间的推移而变化,只有高效率的数据护理技术才能充分发挥数据的价值。③ 。即 (Variety),大数据的数据来源多,既有 ,也有 。正因为大数据来自多种数据源,其数据 不可能保持一致,各种 、 和 数据共存是大数据的普遍现象。④ 。即 (Vaule),大数据蕴含着巨大的价值,但因其数据量庞大,可能发挥价值的仅是其中非常小的部分,价值密度相对 。价值密度的高低与数据总量的大小成 。大数据思维大数据是一场变革,改变的不仅仅是数据,还有人们的思维。首先,大数据要分析的是 ,而不是 。其次,对于数据不在追求 ,而是能够接受数据的 。在大数据处理过程中,数据的来源多种多样,这些数据可以是 、 、也可以是。当数据量大到一定程度时,个别数据的不准确就显得 。再次,不一定强调对事物 ,而是更加注重他们的 。大数据对社会的影响大数据让生活 ;大数据让决策 ;大数据带来新的 ;大数据带来新的 ,如信息泄露、 等方面社会问题。 展开更多...... 收起↑ 资源预览