资源简介 (共37张PPT)3.1数据编码121%0Learning Objectives学习目标01020304了解数据采集的基本方法了解文本数据的编码掌握二进制与其他进制的转换理解数据编码的意义与作用在办理身份证的流程中,管理系统都收集了哪些数据?该数据如何进行采集?思考:模拟信号数字信号采集信息存储数据1模拟信号与数字信号Analog Signal and Digital Signal模拟信号与数字信号A信号按取值特征用传感器直接获得的信号如声音、温度、压强。用连续变化的物理量来表示信息。值随时间连续变化,波形光滑01模拟信号模拟信号与数字信号A信号按取值特征02可由模拟信号转换得来是离散变化的,波形如台阶,数字信号的值即数字数据直接用计算机所能理解的二进制(0、1)表示数字信号分析、比较模拟信号与数字信号在通信应用中的优劣名称 优点 缺点模拟信号 1.信息密度高 2.容易实现 1.抗干扰能力差2.保密性差数字信号 1.抗干扰能力强 2.保密性强 3.便于存储、加密、纠错 1.技术要求高2.模数转换可能带来量化误差数字化:将文字、图像、声音、视频等数据转换成手机或计算机中可以保存、处理、传输、发布的对象即数字化过程。模拟信号的数字化模拟数据数字数据①采样 ②量化 ③编码第一步:采样时间振幅模拟信号的数字化——以音频为例第一步:采样时间振幅采样频率=时间间隔的倒数常用的CD音质的采样频率是44.1kHz,也就是把1秒的时间分成44100等份,平衡点模拟信号的数字化——以音频为例模拟信号的数字化——以音频为例第二步:量化时间振幅将所得的振幅瞬时值往最接近的整数(四舍五入)取整。将量化的整数二进制数值表示的过程模拟信号的数字化——以音频为例第三步:编码样本序号 1 2 3 4 5 6 7 8 9 10量化值 (十进制) 1 2 3 4 3 2 2 2 3 3二进制编码001 010 011 100 011 010 010 010 011 0112数制转换数制转换二进制(Binary)数码:每位上可能的基本数字。0、1基数:每位上可能的数码个数2。位权:每位上的1所表示的数值大小。从右向左依次是:20、21、22、23 ···规则:逢二进一(1+1=10)1 0 1 123 22 21 2010010(2)0b100100B10010(10010)b数制转换十进制(Decimal)数码:每位上可能的基本数字。基数:每位上可能的数码个数10。位权:每位上的1所表示的数值大小。从右向左依次是:100、101、102、103 ···规则:0、1、2、3、4、5、6、7、8、9逢十进一(1+9=10)100(10)0d1000D100数制转换八进制(octal)数码:每位上可能的基本数字。基数:每位上可能的数码个数8。位权:每位上的1所表示的数值大小。从右向左依次是:80、81、82、83 ···规则:0、1、2、3、4、5、6、7逢八进一(1+7=10)23(8)0o230O23数制转换十六进制(Hexadecimal)数码:每位上可能的基本数字。基数:每位上可能的数码个数16。位权:每位上的1所表示的数值大小。从右向左依次是:160、161、162、163 ···规则:0~9、A、B、C、D、E、F逢十六进一(1+F=16)1E(16)0x1E0X1E进制转换方法:8421法95%20%数制转换十进制转二进制:222221894210十进制转二进制:例:十进制18→二进制数01001低位高位余数18(10) = 10010(2)除2反向取余法将十进制转换成R进制(R>=2),采用除R取余法;短除法18(10) = (8)18(10) = (16)2212数制转换二进制转十进制:例:二进制10010十进制数( 1 0 0 1 0)22423222120= 0×20+1×21+0×22+0×23+1×24= 0+2+0+0+16=18按权展开求和::数字与对应权值相乘的和;22(8)= (10)10010(2)=18(10)12(16)= (10)数制转换小练习11100(2) = ( )(10)3D(16) = ( )(10)29(10) = ( )(16)100(10) = ( )(8)E2(16) = ( )(2)11100101(2) = ( )(16)28611D14411100010E5int(“ ”,R)将R进制转十进制十进制转换二进制用bin()函数八进制用oct()函数十六进制用hex()函数数制转换函数程序体验bin( ) 转二进制 0b前缀oct( ) 转八进制 0o前缀hex( ) 转十六进制 0x前缀dec 代表十进制注:结果显示均为字符串hex(0o100)bin(0x100)oct(0b100)bin(100)oct(100)hex(100)int(num,R) :将R进制的整数num转十进制,这里num要使用字符型(常数两端加上引号)也可直接在给num带上前缀计算int('11011010',2)int('2071',8)int('FF',16)int(0b11011010)int(0o2071)int(0xff)二八数制转换18(10) = 10010(2)18(10) = 22(8)010 0102 2二进制转八进制:从右往左,3位一组,不够补0123(8)= (2)1010011二与十六进制转换18(10) = 10010(2)0001 00101 2二进制转十六进制:从右往左,4位一组,不够补018(10) = 12(16)(110110111)2=( )161B7二进制单位与范围比特(bit),计算机中存储数据的最小单位。1比特表示两种状态,0或1。212比特表示四种状态,00、01、10、11。22种状态3比特八种状态,000、001、010、011、100、101、110、111。即238比特=1字节,计算机存储数据的基本单位(Byte,简写B),1字节二进制数表示28(256)n比特 表示2n种状态。单位换算关系存储单位 换算关系B(byte),字节 1B = 8b(bit,位)KB(kilobyte),千字节 1KB = 210B = 1024BMB(megabyte),兆字节 1MB = 210KB = 1024 KBGB(gigabyte),吉字节 1GB =210MB = 1024MB字节单位太小,常用的存储单位有KB,MB,GB等。更高的还有TB太字节、PB拍字节、EB艾字节5.3GB=( )B=( )bWave格式音频文件的存储容量计算公式:存储容量(位)=采样频率(Hz) X 量化位数(bit) X 声道数 X 时长(s)在GoldWave软件中录制了一段10分钟的Wave格式音频,状态信息如图所示:请计算该音频的存储容量。存储容量(bit)=44100*16*2*10*60 (bit)存储容量(B) =44100*16*2*10*60/8 (B)声音的编码声音文件大小的计算一段时长1分钟,采样频率为44.1KHz,量化位数为16位,双声道立体声的无压缩音频,其占用的存储空间是 MB (精确到0.1)声音文件大小(单位:B,字节)= 时长(秒) * 采样频率(Hz) * 量化位数 * 声道数 / 8= 60 * 44.1 * 1000 * 16 * 2 / 8= 10584000B≈ 10335.9KB≈ 10.1MB一幅图像可以看作有许多彩色或各种级别灰度的点组成的,这些点按横纵进行排列,被称为像素图像的编码①图像采样:单位长度内像素的个数(分辨率)②图像量化:确定色块的精度(颜色深度)③图像编码:每一个像素色块对应的二进制编码通常,图像所占的存储容量的计算公式为:图像所占的存储容量(bit):水平像素数 x 垂直像素数 x 颜色深度例如:图像尺寸为90 x 72像素,颜色深度为1,计算该图像所占的存储容量B图像所占的存储容量=90 x 72 x 1 /8=810B图像的编码图像所占的存储容量(B):水平像素数 x 垂直像素数 x 颜色深度/83文本数据的编码Text Encoding of the dataPython文本的编码——ASCII码字符串就是文本,可以是字母、数字、下划线。用7位或8位二进制,数表示一个字符,集中定义大小写英文字母,标点符号和数字等符号和字符,27共128个,28可存放256个.计算机内部用一个字节来存放一个字符,最高位用0表示。“A”→10100000“65”→1、笔记:(阅读、课堂学习、面试、演讲、研讨会、会议记录等,需记录要点时)接收讯息时,用思维导图作记录,将要点以词语形式记下,把相关的想法用线连上加以组织,方便记忆。使用思维导图的好处是无论信息表达的次序如何,都能放在适当的位置上,在画思维导图的过程中,还可以帮助了解和总结信息及想法。2、复习:(预备考试、预备演说……需加深记忆时)将已知的资料或想法从记忆中以思维导图画出来,或将以往画的思维导图重复再画出,能加深记忆,思维导图也能帮助组织想法,令想法更清楚。3、小组学习:(头脑风暴、小组讨论、家庭或小组计划……需共同思考时)小组共同创作思维导图。首先由各人自己画出自己的想法,然后将各人的思维导图合并并讨论,决定哪些较为重要,再加入新想法,最后重组成为一个共同的思维导图。在这个过程中,每个组员的意见都被考虑,提升了团队归属感及合作。共同思考时,也可产生更多创意和有用的想法,最后的思维导图是小组共同的结晶,各组员有共同的方向和结论。4、创作:(写作、学科研习、水平思维、新计划……需创新时)首先将所有环绕主题的想法都写下来,包括新的、不可能发生的,不用理会对或错。然后再将想法组织合并,重新画出思维导图,不要将不可能的划去,让大脑放松,这时候创意可能产生,然后将思维导图改写。在这个过程中,思维导图帮助我们将大量的想法联系起来,产生新的想法,而且中心目标十分清楚。5、选择:(决定个人行动、团体议决、设定先后次序、解决问题……需做出决定时)当有多个想法要求我们去选择并做出决定时,思维导图可以帮助我们更全面更清晰地明白这个问题。首先将需要考虑的因素、目标、限制、后果及其它可行性用思维导图画出来,再将所有因素以重要程度或喜恶加权,最后尝试做出决定。6、展示:(演讲、教学、推销、解说、报告书……需向别人说出自己的想法时)当我们需要向别人讲解自己的想法时,思维导图可以协助我们在预备时清楚自己的构思,令我们的演说更具组织性,更容易记忆。在演说时利用思维导图可令听众容易明白,不用阅读长篇大论的文字,演说者也不用将预备好的句字读出来,让演说更能配合听众的需要,增加双方的交流。如果有发问时,演说者可灵活地在思维导图上扩张处理,不会迷失在其它思路上。7、计划:(个人计划、行动计划、研究计划、问卷设计、写作、预备会议……需行动前思考时) 当我们要进行计划时,思维导图可帮助我们将所有要留意的想法写出来,再组织成清楚、具目标的计划。设计思维导图时,是环绕主题进行思考的,不会迷失方向,完成设计后很容易组织并写出报告,别人阅读计划时也很容易了解计划脉络,容易跟进。I→ASCII码Unicode码→汉字的编码GB 2312-1980 字符集,收录 6763 个汉字GBK 字符集,兼容GB 2312-1980 标准,收录21003个汉字GB 18030-2005 字符集,收录70244个汉字GB 18030-2000 字符集,收录27533个汉字计算机要处理汉字,但一个汉字至少需要两个字节,16位。216(65526)种编码。在Python中,函数ord()返回的是字符的Unicode码值,函数chr()返回Unicode码对应的字符。Unicode码【做】在Python中输出自己的姓名,但表达式中不得直接出现这些汉字二、文本型数据(字符)的编码通过ord()函数查看字符的编码(十进制显示)通过chr()函数返回对应的字符Python查看数据的编码(实操)课堂小结121%0拜拜! 展开更多...... 收起↑ 资源预览