资源简介 (共23张PPT)项目二:探究计算机中的数据表示认识数据编码第一单元数据与信息学习目标了解数据编码的意义和作用知道数值数据编码的基本方法知道常用的文本数据编码方式了解声音数字化的基本方法了解图像数字化的基本方法编码数值声音图像文本身边的编码车牌号身份证门牌号准考证身份证号身边的编码车牌号身份证门牌号准考证车牌号身边的编码车牌号身份证门牌号准考证准考证号21411082130150准考证号为14位数字,其中前两位数字为年份代码,取该年份的后两位数字,如2021年的年份代码为“21”。第3,4位数字为省份代码,后两位为市(区)代码,后两位为县(区)代码,第9位为考试类型代码,第10位为科类代码,最后4位为顺序号。身边的编码车牌号身份证门牌号准考证门牌号门牌号指钉在门上标明街道名称和房子号码的牌子。门牌号代表着家家户户具体地址的门牌号,对于本地人来说是“脸”,对于外地人来说是“眼”。从树牌号认识编码在项目一的林地鸟类活动调查中,科研人员以树为单位观察并记录每一颗树上鸟的活动数据。给树编号的过程就是一个编码的过程,树牌号是编码的结果。什么是编码?编码是指用预先规定的方法将数字、文字或其他对象转换成规定的符号组合,或将信息、数据转换为规定的脉冲电信号。编码的意义:鉴别(唯一标识)排序(有一定的顺序)专用含义(含有一定的含义)从树牌号认识编码在计算机中,编码一般是指用预先规定的方法就数字、文字、图像、声音、视频等对象编成二进制代码的过程。二进制数和十进制数了解数值数据和文本数据的编码数值数据是一类常见数据,是可用于算术运算的具体数值。计算机中的数值数据是以补码的方式表示的,以十进制数+21和-21的8位编码为例,它们的二进制数原码、反码和补码分别如下:数值数据(+21)10=(+10101)2[+10101]原=00010101[+10101]反=00010101[+10101]补=00010101(-21)10=(-10101)2[-10101]原=10010101[-10101]反=11101010[-10101]补=11101011了解数值数据和文本数据的编码数值数据的编码2. 编码计算机中数值数据的编码分为原码、反码和补码,其编码规则见下表。原码 反码 补码正数 符号位(0)+数字部分 (如果原数不足n-1位,在高位补0) 同原码 同原码负数 符号位(1)+数字部分 (如果原数不足n-1位,在高位补0) 在原码的基础上,符号位不变,其余各位取反 在反码的基础上+1小试牛刀将十进制数+19和-19转换为二进制数后原、反、补码为多少?(+21)10=(+10101)2[+10101]原=00010101[+10101]反=00010101[+10101]补=00010101(-21)10=(-10101)2[-10101]原=10010101[-10101]反=11101010[-10101]补=11101011(+19)10=(+10011)2[+10011]原=00010011[+10011]反=00010011[+10011]补=00010011(-19)10=(-10011)2[-10011]原=10010011[-10011]反=11101100[-10011]补=11101101常用数制了解数值数据和文本数据的编码数值数据的编码1. 转换——十进制转二进制要用计算机存储和处理数值数据,首先要将其转换为二进制数。十进制数转换为二进制数,整数部分的转换方法是除2反向取余,小数部分的转换方法是乘2正向取整。以十进制37.375转换为二进制数为100101.011二进制转十进制十进制328.56拆分:各权位相加3×102+2×101+8×100+5×10-1+6×10-2将二进制数110.11转换为十进制数为多少?(110.11)2 = 1×22+1×21+0×20+1×2-1+1×2-2= 4+2+0+1/2+1/4=( 6.75 )10按权相加法数制的转换——二进制转十进制“按权相加”法,把二进制数首先写成加权系数展开式,然后按十进制加法规则求和。“按权相加”法:让每一位上的数字字符乘以它所代表的权权:基数的若干次幂基数:数制中表示数值所需要的数字字符的总数。二进制的基数为:2按权相加法小试牛刀将十进制数19转换为二进制数为多少?(19)10=(10011)2将二进制数0110011.11转换为十进制数为多少?(0110011.11)2=(51.75)10了解数值数据和文本数据的编码文本数据的编码1. 西文字符的编码字母、数字、标点符号等,称为西文字符。计算机在存储和处理这些西文字符时,需要为每个字符规定一个由0和1组成的代码。目前,国际上普遍采用的西文字符编码标准是ASCII码(American Standard Code for Information Interchange,美国标准信息交换代码)。A的ASCII码是1000001,转换成十进制数为65。a的ASCII码是1100001,转换成十进制数为97。加密解密游戏0100100001000101010011000101000001001000 01000101 01001100 01010000H E L P了解数值数据和文本数据的编码文本数据的编码2. 汉字的编码常用汉字有近5000个,这种信息容量要用2个字节长即16位二进制编码才能满足。1980年,中国国家标准总局发布了中华人民共和国国家标准GB2312-1980《信息交换用汉字编码字符集-基本集》,又称为国标码,国标码用2个字节表示一个汉字,其中每个字节的最高位为0.但是,国标码在计算机内部存储和处理时会与ASCII码发生冲突,为了解决这个问题。汉字编码在计算机内表示时,将每个字节的最高位设为1,这被称为机内码(简称内码)。例如,“大”字的机内码为 1011010011110011,机内码是用最高位均为1的2个字节表示一个汉字,是计算机内部存储,处理汉字所使用的统一编码。了解数值数据和文本数据的编码文本数据的编码2. UnicodeUnicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言,跨平台进行文本转换和处理的要求,目前的Unicode字符分为17组编排,每组称为Plane(平面),每个Plane拥有65536个码位,共1114112个码位。Unicode一般用2个字节表示一个字符(非常偏僻的字符用4个字节),但是,一篇英文文章,用 Unicode编码比用 ASCII编码需要多一倍的存储空间,于是,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是 3个字节,只有很生衛的字符才会被编码成4-6个字节。Unicode的实现方式还有UTF-16和UTF-32等。讨论 思考1、如果 2 区 11 子区中有 10023 棵树,以上的编码规则是否适用?2、1位十进制数能表示多少种情况?2位、3位、N位十进制数呢?编码位数与编码可表示情况之前的关系是怎样的?3、了解身份证号的编码规则,分析一代身份证号与二代身份证号的区别,思考启用二代身份证号的原因?411082200502130212411082050213021课后作业根据学校的实际情况,设计适用的学籍号编码规则,保证每位学生拥有一个唯一的学籍号。 展开更多...... 收起↑ 资源预览