资源简介 3.1数据编码一、学习目标1.了解各类数据采集的基本方法。2.能够解释文本、音频等数据的编码原理。3.理解数据编码的意义和作用。二、重难点突出重点:数据采集与编码的概念难点:二进制与十进制转换,不同数制转换的规律三、主要内容1.导入问题:数据是如何进入计算机的?即它们在计算机内部存储原理。2.基本概念数据编码:一种形式转为另一种形式的过程,或一种格式转为另一种格式的过程。在本学科中,特别是本节中,编码的作用是预定的方法将现实生活中的图文声像变成可以存在电脑里数据,一般是指二进制数。数据采集:通过纸笔记录、传感器等各类设备,按照一定的方法,将现实世界中的信息记录整理保存的过程。为后续数据加工与处理提供来源。两种信号对比:模拟信号 数字信号传感器可直接获取的 可由模拟信号转换得来随时间变化是连续的,波形光滑 随时间变化是非连续的模拟信息的值为模拟数据 数据信号的值为数字数据不可以直接被电脑处理 用二进制数表示,计算机可以直接处理3.模拟信号转数字信号的步骤1)第一步,采样在时间轴上,按照一定的时间间隔,取对应时刻的声波信号的振幅值,如每隔1秒截取波形值,n秒后就得到n个采样结果,这样可以将模拟信号的波形特征通过取样的方式克隆下来。很明显,采样频率越高,取得到采样结果就越多,这样对原波形的表示就越精确,将来还原的声音就越优秀。采样频率指的是每秒采样的次数。1秒采样1次,称采样频率为1Hz,1秒采样10次,称采样频率为10Hz。例如,说CD音质的是44.1kHz,就是每秒取样取样44.1千次。2)第二步,量化将第一步中采样的n个结果,按最接近的整数取整,形成一些不连续的,但与原波形图高度相似的新图表。3)第三步,编码将第二步中得到的n个整数,用二进制数表示,以实现被计算机的识别、处理和存储。二进制数运算规律:逢二进一练习:(1010+1)2=( )2 (1001+1)2=( )2 (1011+1)2=( )2声音的数字化(书P52):必须将模拟声音数据转换为数字数据,这一过程称之为声音的数字化。需要经过采样、量化、编码等步骤实现模拟到数字的转换(A/D转换)A(analog)即模拟信号,D(digital)即数字信号,从采样到编码即为A/D转换,反之将电脑中音频播放出来,即是D/A转换。4.容量单位1)bit,即二进制位,是计算机中存储数据的最小单位(简写为小b)一位二进制数,我们称为1bit,可以是(1)2、(0)2,有两种状态,容量为2。两位二进制数,我们称为2bit,可以是(00)2、(01)2、(10)2、(11)2,有四种状态,容量为4。那n位二进制数,我们就可以称之为nbit,有2n次种状态,容量为2n。2)Byte,即字节,是计算机中存储数据的基本单位(简写为大B)8位二进制数,即8bit=1Byte,有28种状态,容量是2563)容量单位及关系:1KB=1024B这里我们可以回忆一下小学知识,10mm=1cm、10cm=1dm、10dm=1m,是类似的,只不过在计算机里的这些单位是每210上一个台阶的。比KB大的依次是MB,GB,TB,它们的转换关系是:1024KB=1MB、1024MB=1GB、1024GB=1TB。因为1024=210,所以可写成:210B=1KB、210KB=1MB、210MB=1GB、210GB=1TB。从大到小分别是TB、GB、MB、KB、B有人问你工资几K,是什么意思呢?这里的K实际上就是套用计算机里的容量单位,因为1K=1024≈10005.二进制与十进制的相互转换(编码计算)计算机内部只能识别和处理二进制数,所以十进制要转为二进制;二进制不方便人类阅读,又常常需要转化为十进制数显示。因此,我们需要掌握这两种数据的转换方法,并找到不同数据制转换的规律。二转十 十转二(10010)2 (18)10按权展开求和法 除二取余倒转法(1010+1)2=( )10 (25)10=( )2★数制转换的一个法宝:程序员计算器6.其它进制数除了二进制数、十进制数,还有八进制、十六进制。十六进制与十进制对应关系表十六 (0)16 (1)16 (2)16 (3)16 (4)16 (5)16 (6)16 (7)16 (8)16 (9)16 (a)16 (b)16 (c)16 (d)16 (e)16 (f)16十 (0)10 (1)10 (2)10 (3)10 (4)10 (5)10 (6)10 (7)10 (8)10 (9)10 (10)10 (11)10 (12)10 (13)10 (14)10 (15)10八进制与十进制对应关系表八 (0)8 (1)8 (2)8 (3)8 (4)8 (5)8 (6)8 (7)8 (10)8 (11)8十 (0)10 (1)10 (2)10 (3)10 (4)10 (5)10 (6)10 (7)10 (8)10 (9)10十进制转R进制:除R取余倒转法R进制转十进制:按权展开求和法7.编码与字符查询函数(选讲、选练)ord(‘字符’)得到对应的编码值、chr(编码值)得到对应的字符,两个功能正好相反bin(R进制数)得到对应的二进制数、int(R进制数)得到对应的十进制数hex(R进制数)得到对应的十六进制数、oct(R进制数)得到对应的八进制数8.文本数据的编码1)ASCII码(美国信息标准交换码)用7位二进制数或8位二进制数表示一个字符,可以容纳128个符号。换个说法,一个字符占用一个字节,这里的字符主要是英文字母和数字,而不是指中文汉字字符。★看表(p54),数字<大写字母<小写字母知道A的ASCII码编码为65,那B的ASCII码就是66,那么F的ASCII码就是70,可以扒手指头算2)Unicode码用两个字节,即16位二进制数表示一个符号,可以容纳65536种符号。所以它就可以用来存放汉字、各国的文字符号,注意在Unicode编码方案中一个汉字符占用两个字节3)汉字编码方案(作为了解)汉字编码方案 字符容量 演变GB2312-19810 6763个汉字GBK 21003个汉字 兼容GB2312-19810GB18030-2000 27533个汉字 GBK+CJK_AGB18030-2005 70244个汉字 GBK+CJK_A+CJK_B9.图像与视频编码图像:采样方式不同,在空间上的变化。视频:采样方式增加,图像在时间上的变化,同时叠加音频数据,因此数据量很大,往往需要压缩。图像文件大小的计算方法:图像分辨率*图像量化位数/8 注意多少位色与多少色的区别,注意单位换算视频文件大小的计算方法:(音频码率+视频码率)*时长/8 注意单位换算总结:本节内容较多,考点较多,比较基础,课上要节奏快点。下一节课前要做好练习巩固。 展开更多...... 收起↑ 资源预览