资源简介 (共21张PPT)3.1 数 据 编 码第二课时学习目标了解各类数据采集的基本方法理解数据编码的意义和作用能够解释文本、音频等数据的编码原理01020304二进制与其他进制的转换。声音的数字化过程编码量化对采样数据进行量化将量化后的数据用二进制数值表示对模拟声音信号按给定的时间间隔进行采样采样复十进制数基数:权值:100,101,102,103所能使用的数字:计数规则:1935(10)=5*100+3*101+9*102+1*103二进制数计数规则:1001(2)=1*20+0*21+0*22+1*23= 9(10)基数:所能使用的数字:20,21,22,230和12逢二进一即1+1=10权值:0…9逢十进一 即9+1=1010=5×1+3×10+9×100+2×1000一、进制转换学按权展开求和十六进制数一、进制转换点基数:16逢十六进一ABCDEF(abcdef)分别相当于十进制数的10~15基本计数规则:权值:160,161,162,163,……例:十六进制整数3D(16)所用数字:=D(13)*160+3*161=61(10)0...9,一、进制转换测十进制R进制二进制八进制十六进制按权展开求和1011(2)2C(16)231(8)=1*20+1*21+0*22+1*23=11(10)=C*160+2*161=44(10)=1*80+3*81+2*82=153(10)BinaryOctalHexadecimalDecimal把十进制数除以2,所得余数做为二进制的最低位数;再把商除以2,所得余数作为次低位数;如此反复,直到商等于0为止;从下往上读出二进制数字。一、进制转换学十进制转二进制自学课本P60将55(10)转换为二进制数除2取余法把十进制数除以2,所得余数做为二进制的最低位数;再把商除以2,所得余数作为次低位数;如此反复,直到商等于0为止;从下往上读出二进制数字。552227……1213……16……13……0221……120……11 1 0 1 1 1 B202122232425******32+16+0+4+2+1=55 D一、进制转换点十进制转二进制自学课本P60将55(10)转换为二进制数除8取余法一、进制转换练十进制转十六进制十进制转八进制除16取余法55886……70……66 7 O8081**48+7=55 D5516163……70……33 7 H160161**48+7=55 D同一个数值用任何数制表示都是一样的。以55为例一、进制转换结十进制R进制除R取余法二进制八进制十六进制按权展开求和BinaryOctalDecimalHexadecimalint(num,R) #R进制的整数num转换为十进制, num需是字符串类型bin(num) #十进制整数num转换为二进制oct(num) #十进制整数num转换为八进制hex(num) #十进制整数num转换十六进制一、进制转换拓二进制转八进制1 0 1 1 0 1 1 1 B01.取3合1,不足3位时,补02.从右到左按权展开求和得到八进制数十进制 二进制01234567二进制转十六进制?一、进制转换测110100(2)=( )(10)3D(16)=( )(10)255(10)=( )(16)56 D=( )B5261FF111000数制转换字母、特殊字符、汉字如何编码?多媒体信息编码字符——>编码值编码值——>字符十进制——>二进制二、文本数据的编码学课本P60活动2,用python进行编码1.ord()函数:查看自己名字中每个字符对应的存储编码值2.chr()函数:查看整数编码值( 0 - 1114111)对应的字符3.bin()函数:将十进制转换为相应的二进制字母、数字、标点符号、汉字ASCII码Unicode码二、文本数据的编码学二进制标准ASCII码(用7位二进制数表示一个字符)扩展ASCII码(用8位二进制数表示一个字符)计算机内部用一个字节(1B=8bit)来存放一个ASCII码字符,最高位用0表示。ASCII码位数表示表示字符大小写英文字母、标点符号、数字等,共128个二、文本数据的编码学二、文本数据的编码学产生原因Unicode字符集ASCII码与unicode码的关系解决传统字符编码方案的局限性,用2个字节表示一个符号。是全球可以共享的编码字符集,涵盖了世界上主要文字的字符,其中包括简繁体汉字,共计74686个汉字。后者兼容前者,原来用ASCII码能表示的字符,其对应的unicode码只是在原来的ASCII码前加上8个0。比如“a”的ASCII码是01100001,其unicode码是00000000 01100001二、文本数据的编码学Unicode码共收录6763个汉字兼容GB 2312—1980标准,收入21003个汉字包含GBK字符集和CJK统一汉字扩充A的汉字,共计27533个汉字在GB18030—2000的基础上,增加了CJK统一汉字扩充B的汉字及其他汉字, 共计70244个汉字二、文本数据的编码学GB 2312—1980字符集GBK字符集GB 18030—2000字符集GB 18030—2005字符集课堂小结结感 谢 观 看 展开更多...... 收起↑ 资源预览