资源简介 课程基本信息课题《数据编码——字符编码》教科书书名:《信息技术必修1:数据与计算》出版社:人民教育出版社、中国地图出版社出版日期:2019年6月教学目标教学目标:1.知道字符编码作用,了解常见字符编码方案ASCII、GB2312-1980、GBK、GB18030-2005、unicode字符集及编码方案。【信息意识】【计算思维】2.了解计算机处理字符的过程,知道中文汉字的输入码、机内码以及输出码。【信息意识】【计算思维】3.掌握常见字符处理问题(txt文档与网页乱码现象、Word中文字重叠)的解决方法,能够根据需要选择合适的字符编码。【信息意识】【数字化学习与创造】教学重点:常见的字符编码方案教学难点:常见字符处理问题的解决方法教学过程时间教学环节主要师生活动2分钟提出真实问题、确立探究主题在日常使用计算机的时候,同学们有没有遇到过这样的情况或问题呢:打开文本文档、浏览网页时出现了乱码现象Word文件中出现了文字重叠的情况遇到这些情况时,我们该怎么办呢?若想解决问题,必要知其原理。今天,我们就和大家一起来探究计算机是如何处理字符的。15分钟辨析概念原理、理解字符编码计算机作为数据处理的一种工具,只识别0和1的二进制。因此,在处理各种对象时需要将其转换成计算机可识别的二进制数据。那么字符是如何转变成二进制的呢?(一)探究一:字符如何变成二进制?1.字符编码的概念字符编码是按照预先确定的规则,将所需字符转换映射为计算机可以接受的二进制数字的过程。字符编码方案会为每个字符指定对应的数字编码,便于不同计算机系统间交换文件,产生的编码叫做交换码。字符编码包括字符集(系统支持的所有抽象字符的集合)与字符编码(方案)(符号集合与数字系统间建立对应关系的法则)。(1)英文字符编码方案——ASCII在早期应用时,计算机只用处理英文字母、数字和常用的英文标点符号。为了处理英文字符,美国信息标准协会制定ASCII(AmericanStandardCodeforInformationInterchange)美国信息交换标准代码。在ASCII编码方案中,制定了包含128个英文字符的字符集,包括英文大小写字、数字、常用符号等。提问思考:至少需要几个字节可以表示128个字符呢?1个字节为8位,可以表示256种情况。因此,ASCII采用1个字节对128个字符进行编码。体验活动:利用编码输入字符在输入英文字符时,我们可以通过键入字符、插入符号等方式,也可以利用ALT+ASCII编码来输入。(2)中文字符编码方案当计算机引入中国后,我国的中文汉字多达10万多个,1个字节的ASCII编码已无法满足需求。因此,我国设计了GB系列字符编码用于将汉字转换为计算机可接受的数字。GB2312-19801980年,我国颁布了GB2312-1980,即《信息交换用汉字编码字符集——基本集》。共收录了6763个汉字,以及包括数字、拉丁字母、希腊字母等在内的682个字符。GB2312-1980兼容ASCII编码,依然用单字节表示ASCII规定的英文字符,采用2个字节表示1个汉字以及其他字符。GBKGB2312基本满足了计算机处理汉字的需要,但未包含人名、古汉语等方面出现的罕用字。在GB2312的基础上我们又增加了2万多个字符1995年,形成了GBK《汉字内码扩展规范》,。GB18030-2005在GBK的基础上,GB18030-2005又增加了少数民族的文字。采用单字节、双字节和4字节的变长编码,且能够向下兼容GBK、GB2312和ASCII。(3)unicode字符集与编码方案每个国家拥有自己的语言和文化,在使用计算机时也会建立自己的字符编码。随着互联网将世界连接起来,各个国家采用的字符编码不同,信息交流时就会产生问题。那么有没有一种编码方案能够容纳世界上的所有字符,实现集大成者呢?面对这样的情况,国际标准化组织和Unicode组织制定了unicode字符集,致力于将世界上所有文字和符号都纳入,以满足使用不同语言的人利用计算机进行信息交流。对于unicode字符集,常见的编码方案有UTF-8、UTF-16、UTF-32等。(4)体验活动:txt中的联通刚刚我们学习了常见的字符编码,下面我们通过实践体验一下不同的字符编码对字符处理会产生什么样的影响。①体验实践请同学们在自己的计算机中新建一个txt文档,输入“联通”两个汉字,保存后再打开看看会出现什么?②原理分析经过实践,同学们发现“联通”两个字变成了乱码,那么这是为什么呢?让我们通过一段短片来看一下。③问题解决文本文档【另存为】-【编码】选项中选择合适的字符编码。(二)探究二:计算机处理字符时要经历哪些过程?1.计算机处理字符的基本工作过程通过键盘等方式输入字符,在计算机内部进行存储和处理,最后通过显示屏等输出。(1)输入字符英文字符:利用键盘直接键入中文汉字:输入码(外码)输入码是将汉字与键盘能建立对应关系,实现利用键盘将汉字输入到计算机中。(2)处理字符英文字符:ASCII编码中文汉字:机内码(由交换码计算而来)由于GB2312-1980等编码方案兼容ASCII编码,以3021(十六进制)为例,它在GB2312-1980和ASCII中表示不同,计算机就会产生歧义。因此,计算机在处理中文汉字时,要在交换码的基础上计算得出机内码。(3)输出字符字型码用于字符在显示屏或打印机输出,又称输出码、字模码,通常有两种表示方式:点阵和矢量。不同的字体库拥有不同的字形码。2.小结计算机处理字符的过程环节英文中文输入键盘直接键入输入码(拼音、五笔等)处理ASCII编码机内码输出字型码(输出码):点阵&矢量6分钟解决常见问题、应用所学实践1.问题1:如何解决乱码的问题?解决方法:选择合适的字符编码方案(1)txt文档——另存为选择编码方案(2)网页——右击选择编码方案2.问题2:如何解决Word中的文字重叠?解决方法:字间距设置,选择合适的字体库3.问题2拓展:Word能不能同时保存字体?解决方法:保存时嵌入字体库学生根据演示视频学习保存Word文件时嵌入字体库的方法并实践。2分钟回顾复习新知、自评学习效果1.回复复习所学知识2.利用小测自评学习效果Q1.在GB2312-1980中,一个汉字占用几个字节?(单选)()A.1个B.2个C.4个Q2.以下哪些是常用汉字的编码方案?(多选)()A.ASCIIB.GB2312-1980C.GBKD.GB18030-2005Q3.用计算机处理汉字,可能要经历哪些编码过程?(单选)()A.输入码->ASCII码->字型码B.字型码->机内码->输入码C.输入码->机内码->字型码E.unicode字符集与UTF-8编码(共48张PPT)数据编码——字符编码(第四课时)你遇到过这些问题吗?文档网页出现乱码你遇到过这些问题吗?下载Word文字重叠计算机是如何处理字符的?计算机是如何处理字符的?字符如何转换成二进制?一、字符编码字符(文字、符号等)数字(二进制等)预先确定的规则每个字符拥有对应的数字编码便于不同计算机系统间交换信息交换码编码方案一、字符编码字符(文字、符号等)数字(二进制等)预先确定的规则编码方案字符集方案支持的所有抽象字符的集合字符编码字符集与数之间建立对应关系的法则1.英文字符编码英文字母数字英文标点符号……1.英文字符编码ASCII编码美国信息交换标准代码(AmericanStandardCodeforInformationInterchange)字符集:大小写字母、数字、常用符号等128个字符1.英文字符编码001100000001100011001100102001100113……01000001A01100001a01000000@00101011+……128个字符几个字节?1.英文字符编码ASCII编码美国信息交换标准代码(AmericanStandardCodeforInformationInterchange)字符集:大小写字母、数字、常用符号等128个字符字符编码:利用1个字节对128个字符进行数字编码体验活动:利用ASCII码输入字符ALT键+数字(十进制)2.中文字符编码2.中文字符编码《信息交换用汉字编码字符集——基本集》收录6763个汉字,及包括数字、拉丁字母等在内的682个字符字符编码:兼容ASCII编码;1个字节表示ASCII规定的英文字符,采用2个字节表示1个汉字以及其他字符。GB2312-19802.中文字符编码GB2312-1980扩充2万多个字符GBK《汉字内码扩展规范》2.中文字符编码GB2312-1980GBKGB18030-2005收录7万多个汉字兼容GB2312-1980、GBK、ASCII等采用多字节编码,包括1个、2个、4个字节2.中文字符编码GB2312-1980GBKGB18030-2005GB18030-2005GBKGB2312-1980ASCII3.通用字符编码方案unicode字符集与编码方案致力于纳入世界上所有字符国际化标准组织和Unicode组织联合制定unicode字符集字符编码方案UTF-8UTF-16UTF-32……不同语言的人使用计算机体验活动:txt中的“联通”新建一个txt文本文档,输入“联通”两个字,保存后再打开看看会如何?体验活动:txt中的“联通”新建一个txt文本文档,输入“联通”两个字,保存后再打开看看会如何?为什么会出现乱码?资料体验活动:txt中的“联通”为什么会出现乱码?相同数字在各字符编码代表可能不同选择合适的字符编码二、计算机处理字符的过程存储、操作、传输等处理显示屏输出、打印输出等输出利用键盘等输入字符输入1.输入字符:输入码利用键盘等输入字符输入英文字符键盘对应,直接输入加入我们!1.输入字符:输入码利用键盘等输入字符输入中文汉字拼音、五笔等输入码(外码)建立汉字与键盘的关系加入我们!二、计算机处理字符的过程环节英文中文输入键盘直接键入输入码(拼音、五笔等)2.内部处理:ASCII编码&机内码存储、操作、传输等处理英文字符字符二进制中文字符ASCII编码2.内部处理:ASCII编码&机内码例:3021(十六进制)0!啊GB2312ASCII编码产生歧义!GB18030-2005GBKGB2312-1980ASCII2.内部处理:ASCII编码&机内码英文字符字符二进制中文字符ASCII编码机内码基于交换码计算存储、操作、传输等处理二、计算机处理字符的过程环节英文中文输入键盘直接键入输入码(拼音、五笔等)处理ASCII编码机内码3.输出字符:字型码显示屏输出、打印输出等输出字符二进制字型码3.输出字符:字型码用于字符在显示屏或打印机输出又称输出码、字模码通常有两种方式:点阵和矢量字型码显示屏输出、打印输出等输出3.输出字符:字型码点阵码3.输出字符:字型码二、计算机处理字符的过程环节英文中文输入键盘直接键入输入码(拼音、五笔等)处理ASCII编码机内码输出字型码(输出码):点阵&矢量三、解决常见的字符处理问题问题1:如何解决显示乱码?解决方法:选择合适的字符编码方案三、解决常见的字符处理问题问题1:如何解决显示乱码?解决方法:选择合适的字符编码方案txt文本文档另存为—>选择编码三、解决常见的字符处理问题问题1:如何解决显示乱码?解决方法:选择合适的字符编码方案网页:右击—>选择编码三、解决常见的字符处理问题问题2:如何解决Word中的文字重叠?解决方法:字间距设置,选择合适的字体库三、解决常见的字符处理问题问题2拓展:Word能不能同时保存字体?解决方法:保存时嵌入字体库三、解决常见的字符处理问题四、小结与练习字符编码字符编码概念计算机处理汉字的编码过程含义:字符转换成二进制组成:字符集和编码方式等常见字符编码方案作用:便于不同系统交换信息英文:ASCII编码通用:unicode字符集与编码方案(UTF-8等)中文:GB2312-1980、GBK、GB18030-2005输入:输入码(拼音、五笔等)输出:字型码(点阵&矢量)处理:机内码(基于交换码计算而得)四、小结与练习Q1.在GB2312-1980中一个汉字占用几个字节?Q2.常用汉字的编码方案有哪些?Q3.用计算机处理汉字,可能要经历哪些编码过程?课后练习Q1.在GB2312-1980中,一个汉字占用几个字节?(单选)()A.1个B.2个C.4个Q2.以下哪些是常用汉字的编码方案?(多选)()ASCIIB.GB2312-1980C.GBKD.GB18030-2005E.unicode字符集与UTF-8编码Q3.用计算机处理汉字,可能要经历哪些编码过程?(单选)()A.输入码->ASCII码->字型码B.字型码->机内码->输入码C.输入码->机内码->字型码正确答案:BBCDEASCII是英文字符编码。C学习任务单课程基本信息课题《数据编码——字符编码》教科书书名:《信息技术必修1:数据与计算》出版社:人民教育出版社、中国地图出版社出版日期:2019年6月学生信息姓名学校班级学号学习目标(1)知道字符编码作用,了解常见的字符编码方案ASCII、GB2312-1980、GBK、GB18030-2005、unicode字符集及编码方案。【信息意识】【计算思维】(2)了解计算机处理字符的过程,知道中文汉字的输入码、机内码以及输出码。【信息意识】【计算思维】(3)掌握常见字符处理问题(txt文档与网页乱码现象、Word中文字重叠)的解决方法,能够根据需要选择合适的字符编码。【计算思维】【数字化学习与创造】课前学习任务1.准备好任务单。2.在自己的电脑中安装好Word软件。课上学习任务【学习任务一】体验活动:利用ASCII码输入字符请同学们打开ASCII编码表,查找字符对应的十进制数字。新建word文件,利用ALT+十进制数字尝试输入字母或符号,例如ALT+65输入A。其中,十进制数字要通过数字小键盘输入。提示:如果使用的笔记本电脑没有数字小键盘,同学们可以通过【开始】-搜索【屏幕键盘】-点击【NumLock】,打开屏幕键盘中的数字小键盘。标准ASCII编码表见最后。请将你的输入结果截图放在下面:【学习任务二】体验活动:txt中的“联通”请在自己的计算机上新建一个txt文档,输入“联通”两个字,保存后再打开看看会出现什么?出现乱码的原因是:____________________________________________解决的办法是:__________________________________________________【学习任务三】任务实践:Word保存嵌入字体库请同学们根据课程中的演示,学习如何在Word设置文件保存嵌入字体库。推荐的学习资源字符所占的存储容量用点阵表示字型时,根据汉字的不同要求所有的点阵也不一样。通常,显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。根据点阵的大小,可以计算出一个汉字所需占用的空间。例如16×16点阵的汉字字模,每个小格是1b,字模大小就是16b×16b/2=32B,即16×16点阵表示一个汉字,字形码需用32字节。2.ANSI编码在unicode字符集及其编码方案问世前,各个国家都在ASCII编码的基础上设计了自己国家的编码方案。所有这些各个国家和地区所独立制定的既兼容ASCII又互相不兼容的字符编码,微软统称为ANSI编码。在Windows系统中,ANSI编码一般代表系统默认编码方式。例如,在简体中文操作系统中ANSI编码默认指的是GB系列编码(GB2312、GBK、GB18030)标准ASCII编码二进制十进制十六进制字符/缩写解释00000000000NUL(NULL)空字符00000001101SOH(StartOfHeadling)标题开始00000010202STX(StartOfText)正文开始00000011303ETX(EndOfText)正文结束00000100404EOT(EndOfTransmission)传输结束00000101505ENQ(Enquiry)请求00000110606ACK(Acknowledge)回应/响应/收到通知00000111707BEL(Bell)响铃00001000808BS(Backspace)退格00001001909HT(HorizontalTab)水平制表符00001010100ALF/NL(LineFeed/NewLine)换行键00001011110BVT(VerticalTab)垂直制表符00001100120CFF/NP(FormFeed/NewPage)换页键00001101130DCR(CarriageReturn)回车键00001110140ESO(ShiftOut)不用切换00001111150FSI(ShiftIn)启用切换000100001610DLE(DataLinkEscape)数据链路转义000100011711DC1/XON(DeviceControl1/TransmissionOn)设备控制1/传输开始000100101812DC2(DeviceControl2)设备控制2000100111913DC3/XOFF(DeviceControl3/TransmissionOff)设备控制3/传输中断000101002014DC4(DeviceControl4)设备控制4000101012115NAK(NegativeAcknowledge)无响应/非正常响应/拒绝接收000101102216SYN(SynchronousIdle)同步空闲000101112317ETB(EndofTransmissionBlock)传输块结束/块传输终止000110002418CAN(Cancel)取消000110012519EM(EndofMedium)已到介质末端/介质存储已满/介质中断00011010261ASUB(Substitute)替补/替换00011011271BESC(Escape)逃离/取消00011100281CFS(FileSeparator)文件分割符00011101291DGS(GroupSeparator)组分隔符/分组符00011110301ERS(RecordSeparator)记录分离符00011111311FUS(UnitSeparator)单元分隔符001000003220(Space)空格001000013321!?001000103422"?001000113523#?001001003624$?001001013725%?001001103826&?001001113927'?001010004028(?001010014129)?00101010422A?00101011432B+?00101100442C,?00101101452D-?00101110462E.?00101111472F/?0011000048300?0011000149311?0011001050322?0011001151333?0011010052344?0011010153355?0011011054366?0011011155377?0011100056388?0011100157399?00111010583A:?00111011593B;?00111100603C<?00111101613D=?00111110623E>?00111111633F??010000006440@?010000016541A?010000106642B?010000116743C?010001006844D?010001016945E?010001107046F?010001117147G?010010007248H?010010017349I?01001010744AJ?01001011754BK?01001100764CL?01001101774DM?01001110784EN?01001111794FO?010100008050P?010100018151Q?010100108252R?010100118353S?010101008454T?010101018555U?010101108656V?010101118757W?010110008858X?010110018959Y?01011010905AZ?01011011915B[?01011100925C\?01011101935D]?01011110945E^?01011111955F_?011000009660`?011000019761a?011000109862b?011000119963c?0110010010064d?0110010110165e?0110011010266f?0110011110367g?0110100010468h?0110100110569i?011010101066Aj?011010111076Bk?011011001086Cl?011011011096Dm?011011101106En?011011111116Fo?0111000011270p?0111000111371q?0111001011472r?0111001111573s?0111010011674t?0111010111775u?0111011011876v?0111011111977w?0111100012078x?0111100112179y?011110101227Az?011110111237B{?011111001247C|?011111011257D}?011111101267E~?011111111277FDEL(Delete)删除 展开更多...... 收起↑ 资源列表 word如何保存时嵌入字体.mp4 为何联通是乱码.mp4 体验活动:ALT+数字键.mp4 体验活动:txt中的联通.mp4 数据编码——字符编码(第四课时)-任务单.docx 数据编码——字符编码(第四课时)-教学设计.docx.docx 数据编码——字符编码(第四课时)-练习题.docx 数据编码——字符编码(第四课时)-课件.pptx