资源简介 1.2 数据编码 教案(2课时)一、基本信息课题 1.2 数据编码 课时 2课时(每课时45分钟)适用年级 高一(贵州地区) 学生基础 已掌握1.1数据定义、二进制转换,了解计算机处理二进制学科核心素养目标 1. 信息意识:感知编码在贵州大数据、非遗保护中的价值,认识数据编码对信息处理的核心作用;2. 计算思维:通过编码原理推导、存储量计算,建立“符号映射→离散化→标准化”的思维链;3.信息社会责任:理解编码标准对数据安全共享的意义,树立保护本土数字化非遗数据的意识 教学重难点 第1课时重点:文字编码类型与标准;难点:汉字编码的必要性与规则;第2课时重点:图像/声音编码原理、存储量计算;难点:采样/量化/编码的科学逻辑、存储量单位换算课型 新授课 教学准备 1. 教具:PPT课件、网格纸、黑白贴纸、编码表模板;2. 学具:笔记本、笔、草稿纸、手机(含苗寨照片)二、教学过程(分2课时)第1课时:信号本质+文字编码深解(一)情境导入抛出苗寨紧急通知谜题:“苗寨用‘火把长亮=1、短亮=0’传递‘1010’,对应什么信息?”学生自由猜测后,教师揭示“预设规则=统一编码标准”,引出“编码=统一规则+符号映射”。思考:“若没有统一规则,1010还能准确传递‘备好粮食’吗?”学生发言后,教师总结答案:不能。编码的核心是“统一规则+符号映射”,无统一规则时,1010可被解读为任意信息(如“危险”“集合”),无法实现准确通信,这也是编码标准存在的意义。延伸提问:“贵州大数据中心存储苗绣的文字介绍(如‘西江千户苗寨’),需要哪种编码?”,导入第1课时内容。设计意图:用本土场景激发兴趣,建立“编码=规则+映射”的基础认知,渗透信息意识。(二)新知讲授1. 信号分类与本质模拟信号:定义+原理:是指用连续变化的物理量所表达的信息。其信号幅度/频率无断点,如苗歌声波。特征:连续性、渐变式、易衰减,结合山区老式广播杂音案例讲解。思考:“为什么磁带存放越久,苗歌音质越差?”(关联衰减特征)学生讨论后,教师解答答案:磁带记录的是模拟信号,模拟信号具有“易衰减”特征,存放过程中磁带材质老化、磁信号能量损耗,导致信号幅度逐渐减弱,最终音质变差。数字信号:定义+原理:离散脉冲信号,用高低电平对应0/1,不受小幅干扰影响。特征:离散性、抗干扰强、易存储,结合大数据中心数据存储案例讲解。思考:“数字信号的‘离散性’如何解决模拟信号的杂音问题?”教师引导学生分析后,总结答案:数字信号仅含0和1两种离散状态(对应高低电平),小幅干扰不会改变电平的“0/1属性”;而模拟信号是连续渐变的,任何外界干扰都会直接叠加到原信号上,形成杂音。深度对比:师生共同填写信号深度对比表表,重点强调“物理本质”“本土应用”差异。思考:“贵州山区地形复杂,为什么数字信号成为通信主流?”学生发言后,教师补充答案:山区地形会加剧模拟信号的衰减和干扰,导致通信质量差;数字信号抗干扰强、传输距离远,且易通过编码校验修正错误,更适配山区复杂的通信环境。2. 文字编码深解ASCII码:编码逻辑:7位二进制,128种组合,覆盖英文、数字、符号。核心细节:控制字符(0-31)不可见,可显示字符(32-127)含空格、数字(48-57)、大写字母(65-90)、小写字母(97-122)。思考:“已知‘A=65(01000001)’,如何快速推出‘a’的ASCII码?”(提示:差值32)学生计算后,教师核对答案:小写字母与对应大写字母的ASCII码差值为32(十进制),因此“a”的ASCII码=65+32=97(十进制),对应的二进制为01100001。实操练习:查询名字拼音的ASCII码(如“李=LI”,L=76→01001100,I=73→01001001),小组分享结果。汉字编码:编码必要性:ASCII码无法覆盖数万汉字,引出双字节编码。GB2312:6763个常用汉字,16位二进制,高字节最高位为1。GBK:扩展收录21003个汉字,含少数民族文字(如“侗”“苗”)。Unicode:全球通用,兼容ASCII/GBK,解决多语言编码冲突。思考:“为什么汉字编码需要2个字节,而英文仅需1个?”教师结合图表讲解答案:ASCII码用7位二进制可表示128种字符,能覆盖英文、数字和符号;而汉字数量庞大(仅GB2312就收录6763个常用汉字),1个字节(8位)最多表示256种字符,无法满足需求,因此汉字编码需2个字节(16位),可表示65536种组合。编码标准:核心作用:实现设备互通,如贵州政务系统与大数据中心数据共享。本土应用:大数据中心采用Unicode存储多语言文旅数据,避免乱码。思考:“若贵州大数据中心同时存储中文、英文、侗语数据,优先选哪种编码标准?”学生讨论后,教师总结答案:优先选Unicode编码。Unicode是全球通用编码标准,兼容ASCII码(英文)、GBK(中文+少数民族文字),能避免多语言数据存储时出现乱码,实现跨设备、跨语言互通。3. 课堂小测选择题:下列波形描述中 ,哪一项符合模拟信号的特征?(C)。已知字母 'A' 的 ASCII 码是 65 ,则字母 'C' 的二进制编码是多少?(C)在GBK编码标准中 ,存储“贵州”两个汉字 ,至少需要多少个字节?(C)(三)小结与预习课后思考:“第1课时你解锁了哪些‘文字编码密码’?”尝试用自己的话总结ASCII码与汉字编码的区别。引导学生围绕核心方向总结:① 编码是文字与二进制的“翻译规则”;② ASCII码适配英文,汉字需双字节编码;③ 统一编码标准是数据互通的关键;④ 编码与贵州多语言数据存储、政务互通密切相关。小结:用思维导图梳理第1课时知识点,强调“信号→文字编码→标准”的逻辑链。预习任务:观察手机里的苗寨照片(位图),思考“放大后为什么会模糊”;聆听苗歌,猜测“声音如何编码”。设计意图:强化知识体系,为第2课时铺垫,培养自主探究的数字化学习习惯。第2课时:图像/声音编码+存储计算+应用(一)情境导入回顾预习:“苗寨照片放大模糊的原因是什么?”(学生自由发言)。教师结合动画分步揭秘,同步追问思考:动画第一步(清晰):“这一步能看出照片的构成特点吗?”(答案:照片是位图,由像素组成);动画第二步(轻微模糊):“现在出现了什么变化?”(答案:像素颗粒开始显现);动画第三步(严重模糊):“为什么会越来越模糊?该如何解决?”(答案:位图放大失真,矢量图可解决此问题)。衔接:第1课时学文字编码,第2课时深耕图像/声音编码,以及如何计算存储量。设计意图:承接预习,自然导入新知识点,激发信息意识。(二)新知讲授1. 图像编码深解图像编码:在满足一定保真度的条件下,对图像数据进行变换、编码和压缩,以较少比特数表示图像或图像中所包含的信息的技术。图像分类:位图:像素组成,如照片、截图,放大失真,色彩丰富;矢量图:数学公式描述,如Logo,放大不失真,色彩简单。位图文件大小位图采用位映射存储格式,即将每一个像素映射为一个数据,存放在以字节为单位的矩阵中。文件大小=文件头+信息头+颜色表项+图像分辨率×图像量化位数÷8像素:图像最小单位,含颜色信息;分辨率:水平像素×垂直像素(如1024×768),分辨率越高越清晰;量化位数:颜色深度(1bit=黑白、8bit=256灰度、24bit=真彩色)。位图编码深解:颜色映射逻辑:黑白图像:黑=1、白=0;灰度图像:0-255对应不同灰度,包含256个等级。0代表纯黑,255代表纯白,中间数值对应不同深浅的灰色,能细腻表现苗绣照片的光影质感;真彩色图像:RGB三通道,每个通道8bit,组合出16777216种颜色。本土案例:苗绣红色纹样→R=255、G=0、B=0→二进制11111111 00000000 00000000。追问思考:“苗绣的‘靛蓝色’(R=0、G=127、B=255),对应的二进制编码是什么?”学生计算后,教师核对答案:RGB三通道各占8位二进制,因此编码为:R=0→00000000,G=127→01111111,B=255→11111111,完整二进制编码为00000000 01111111 11111111。格式差异:BMP(无压缩)、JPG(有损压缩)、GIF(256色+动画)。追问思考:“贵州文旅官网要上传高清苗绣展品照片,兼顾清晰度和加载速度,选哪种格式?”学生讨论后,教师总结答案:选JPG格式。BMP格式无压缩,文件过大,加载速度慢;JPG是有损压缩格式,会丢弃人眼不敏感的颜色信息,在保证展品清晰度的前提下大幅减小文件体积,适配官网“省流量、快加载”的需求。2. 声音编码深解核心逻辑:模拟声音→数字化三步骤(采样→量化→编码)→二进制存储。声音编码三步骤:采样:按固定时间间隔截取声波样本,采样频率越高,样本越密集(如44.1kHz=每秒44100次),遵循奈奎斯特采样定理;量化:将采样值归入固定等级(如16bit=65536级),等级越多,细节越丰富;编码:将量化等级映射为二进制,记录符号位(正数=0、负数=1)。声音存储量:声音文件大小=采样频率×量化位数×声道数×时间/8核心参数:采样频率、量化位数、声道数,结合苗歌非遗录制(44.1kHz+16bit)、语音导航(22.05kHz)案例讲解。追问思考:“为什么采样频率越高、量化位数越多,还原的苗歌音质越好?”教师引导学生分析后,总结答案:① 采样频率越高,每秒采集的声音样本越密集,能保留更多苗歌的细节(如高音、颤音);② 量化位数越多(如16bit vs 8bit),采样值的等级划分越细,能还原更丰富的声音动态范围,失真越小,音质越接近原声。格式差异:WAV(无压缩)、MP3(有损压缩)、FLAC(无损压缩)。存储量计算闯关(分难度)基础关:1024×768的1bit黑白苗绣纹样扫描图→文件大小=1024×768×1÷8÷1024=95KB。进阶关:分组计算“44.1kHz、16bit、双声道的3分钟苗歌”存储量,教师巡回指导。文件大小=44.1×1000×16×2×3×60÷8÷1024÷1024≈30.28(MB)挑战关:800×600像素,24bit,压缩比1:10的苗绣真彩色JPG照片,求实际存储大小(KB) 原始大小(字节)= 800×600×24÷8=480000×3=1440000 (B)压缩后实际大小(字节):1440000 ÷10÷1024≈14063 (KB)追问思考:“计算时容易忽略哪个参数?如何避免?”学生分享经验后,教师总结答案:容易忽略的参数:① 时间单位(需将“分钟”转为“秒”);② 分辨率(需用“水平像素×垂直像素”计算总像素数);③ 压缩比(JPG/GIF格式需用无压缩大小÷压缩比)。避免方法:计算前先列出所有参数及单位,统一单位后再代入公式。3. 编码的本土深度应用数据存储信号传输智慧体验(三)课堂小测图像编码:下列关于位图参数的描述 ,哪项直接 决定了图像的颜色丰富程度?(B)声音数字化:800×600的8bit灰度苗绣照片,文件大小=800×600×8÷8=480000字节≈468.75KB。存储计算:计算一段 10秒、44.1kHz、 16位、双 声道的无压缩音频文件大小(单位:KB)。(四)小结与作业思考:“2课时学完,你能完整说出‘苗绣从拍摄到存储的编码流程’吗?”引导学生梳理核心答案:① 拍摄:数字相机将苗绣转化为位图(像素阵列);② 图像编码:每个像素的颜色→量化为24bit真彩色等级→映射为二进制;③ 存储:选择JPG/PNG格式压缩编码→大数据中心按Unicode标准关联苗绣文字说明→完成存储。小结:梳理第2课时完整知识点,强调“信号→编码→计算→应用”的逻辑链。拓展延伸:量子编码与非遗保护思维发散(小组自行查阅资料讨论):除了存储,你认为量子编码强大的计算能力还能为贵州非遗保护做些什么?学生畅想后,教师补充答案:(例如:残损非遗的精准复原:像苗绣古件的破损纹样、侗族织锦的残缺经纬,量子编码可通过并行计算分析海量同类非遗样本(如 10 万 + 苗绣纹样数据库),快速匹配残缺部分的原始逻辑,精准复原纹样细节,甚至还原古代染料的色彩配比,让破损非遗重获完整形态。 2. 跨时空虚拟互动展示:依托量子编码的高速计算,打造 “量子 + VR” 非遗体验场景 —— 游客戴上 VR 设备,可与古代苗族绣娘 “同台刺绣”,量子编码实时计算游客针法与传统针法的差异并实时矫正;或 “走进” 清代侗族鼓楼,观看织锦技艺的完整流程,让非遗从 “静态展览” 变成 “动态互动”。 3. 非遗技艺的创新衍生:量子编码可快速拆解非遗核心元素(如苗绣的 “铜鼓纹”、银饰的 “錾刻肌理”),并与现代设计(如服饰、文创、建筑装饰)进行百万种组合计算,在保留文化寓意的前提下,生成符合现代审美的创新方案,助力非遗 IP 商业化转化,让非遗融入日常生活。 4. 非遗传承人的精准培育:通过量子编码分析优秀传承人的技艺参数(如苗绣针法的力度、银饰锻造的火候控制),构建 “量子级技艺模型”,为传承人制定个性化培育方案 —— 针对山区学员基础薄弱的问题,精准定位其与大师的差距,提供阶梯式训练内容,提升传承效率。等)布置课后作业:基础题必做,提升题、实操题选做。答疑环节:编码困惑诊所三、教学反思1.2 数据编码 分层作业(含答案解析·2课时完整版)一、基础题(必做)1、结合教材定义,判断下列信号类型(模拟信号“A”/数字信号“B”):(1)磁带录制的苗族飞歌( )(2)U盘存储的苗绣编码数据( )(3)贵州山区5G信号( )(4)传统胶片相机拍摄的苗寨照片(对应的信号)( )2、填空:(1)ASCII码用______位二进制编码,最多表示______种字符;(2)GB2312编码中,1个汉字占______个字节;(3)图像编码中,位图的最小单位是______,分辨率=×;(4)声音编码的三个核心步骤是______→______→______。3、下列关于编码的说法,正确的是( )A. 模拟信号抗干扰性比数字信号强B. Unicode编码仅能表示汉字C. 位图放大后会失真,矢量图不会D. 声音编码的量化位数越低,音质越好4、已知“A”的ASCII码是65(十进制),计算:(1)“K”的ASCII码(十进制)是______,对应的二进制是______;(2)十进制ASCII码为54的字符是______(提示:“0”的ASCII码是48)。二、提升题(选做,强化存储量计算)计算下列存储量(写出关键步骤,结果保留2位小数):(1)分辨率为1920×1080的24bit真彩色苗绣照片(BMP格式,无压缩),文件大小是多少MB?(2)采样频率为44.1kHz、量化位数为16bit、双声道的5分钟苗族童谣(WAV格式),存储量是多少GB?(3)800×600的8bit灰度苗寨照片(JPG格式,压缩比1:8),实际文件大小是多少KB?三、实操题(选做,本土创新应用)设计“贵州文旅编码方案”(以“黄果树瀑布”为例),要求:(1)文字编码:明确“黄果树瀑布”的编码标准(如Unicode)及二进制编码;(2)图像编码:确定瀑布照片的分辨率、量化位数、存储格式(说明选择理由);(3)声音编码:确定瀑布水声的采样频率、量化位数、存储格式(说明选择理由);(4)提交:用Word或PPT呈现方案,附核心编码逻辑说明。答案及解析一、基础题1、答案:(1)A;(2)B;(3)B;(4)A解析:模拟信号是连续变化的(磁带、胶片信号),数字信号是离散的0/1形式(U盘、5G信号),符合教材定义。2、答案:(1)7;128;(2)2;(3)像素;水平像素;垂直像素;(4)采样;量化;编码解析:ASCII码为7位二进制,128种组合;GB2312汉字占2字节;位图最小单位是像素,分辨率为水平×垂直像素;声音编码三步骤为采样→量化→编码。3、答案:C解析:A选项错误,数字信号抗干扰性更强;B选项错误,Unicode兼容多语言;C选项正确,位图放大失真,矢量图不失真;D选项错误,量化位数越高,音质越好。4、答案及解析:(1)75;01001011解析:“A=65”,“K”是第11个字母,65+10=75;75转换为二进制:75÷2=37余1→37÷2=18余1→18÷2=9余0→9÷2=4余1→4÷2=2余0→2÷2=1余0→1÷2=0余1,逆序得01001011。(2)6解析:“0=48”,54-48=6,对应字符“6”。二、提升题答案及解析:(1)文件大小=1920×1080×24÷8÷1024÷1024≈6.07MB(2)存储量=44100×16×2×300÷8÷1024÷1024÷1024≈0.05GB(3)实际文件大小=800×600×8÷8÷1024÷8≈46.88KB三、实操题(示例答案)答案:(1)文字编码:选择Unicode标准(兼容多语言,适配国内外游客);“黄果树瀑布”的Unicode编码(示例):“黄”=U+9EC4→10011110 11000100,“果”=U+679C→01100111 10011100,“树”=U+6811→01101000 00010001,“瀑”=U+7011→01110000 00010001,“布”=U+5E03→01011110 00000011;(2)图像编码:分辨率1920×1080(高清,满足游客观赏需求),量化位数24bit(真彩色,还原瀑布真实色彩),存储格式JPG(有损压缩,省流量,适配文旅官网快速加载);(3)声音编码:采样频率44.1kHz(音乐标准,还原瀑布水声细节),量化位数16bit(无损音质),存储格式FLAC(无损压缩,保真且省空间,适合游客下载收藏);(4)呈现:用PPT分模块展示,附“编码标准选择理由”“参数适配场景说明”。解析:方案核心是“适配文旅场景”,兼顾清晰度/保真度与存储/加载效率,符合实际应用需求,同时落实数字化创新与信息意识素养。(共31张PPT)1.2 数据编码解码贵州 ——从苗绣纹样到大数据的二进制密码讲授人白凌羽日期2025.09高中信息技术必修1图像声音编码与应用 02揭秘苗绣纹样与苗歌声波的数字化过程,掌握存储量计算公式,探索大数据与5G的本土应用。第2课时信号本质与文字编码 01从苗寨火把到二进制密码,探索模拟与数字信号的奥秘,解析从ASCII到汉字国标码的底层 逻辑。第1课时目录C O N T E N T S多媒体编码 (图像/声音)-nr 信号本质 (模拟/数字)存储计算与应用A 文字编码深解DATA ENCODINGCOURSE OVERVIEW编码的核心定义编码不仅仅是数字的排列,它是信息转换的桥梁。思考一刻如果没有提前约定 “统一规则 ” ,看到火把闪烁“1010”,还能传 递准确信息吗? 从苗寨到大数据中心 就像火把传递信号一样, 贵州大数据中心也是通过无数个微小的 “开关 ” (晶体管),用θ和1来存储苗绣复杂的色彩和纹样信息。第1课时 情境导入: 苗寨紧急通知谜题编码 = 统一规则 + 符号映射谜题揭秘信号1θ1θ紧急信号 远处的火把正在闪烁...信息备好粮食接收序列: 1 θ 1 θ情境:寨老约定,火把闪烁代表不同紧急情况。规则映射查阅约定表短亮 = 0长亮 = 1提示: 不同的村寨如果规则不同,可能会把 “备粮 ”误解为 “撤退 ”。贵州本土案例山区有线广播:依靠电流模拟声波传输,信号随线路长度衰减,易受雷雨干扰出现杂 音。苗族飞歌磁带:利用磁粉分布密度模拟声音强弱,久放后磁粉脱落,导致高音模糊。定义模拟信号是指用连续变化的物理量所表达的信息。其信号波形如同山间连绵起伏的梯田,没有突兀的断点。思考:为什么磁带存放越久 ,苗歌音质越差?提示:关联模拟信号 “易衰减 ”和 “物理介质老化 ”的特征。连续性波形平滑过渡,信息无间断易衰减随时间/距离推移,能量损耗知识点1: 模拟信号连续波形:无断点的流动模拟载体:磁带与胶片形 意 (0-1-0-1)数字信号脉冲波定义与本质数字信号是离散时间信号的数字化表示,在时间上和幅度上都是不连续的。 它仅有 “ 0”和 “ 1” 两种逻辑状态 ,分别对应物理上的低电平和高电平。离散性 (Discreteness)信号波形断点分明 ,无中间过渡态 ,如同开关的通断。抗干扰能力强只要干扰不超过阈值 ,即可完美还原0/1状态 ,有效解决杂音问题。易于存储与计算直接对应计算机二进制位 ,便于在服务器中进行大规模处理。本土应用: 贵州大数据中心利用数字信号存储海量苗绣编码 ,5G技术保障文旅数据在山区复杂环境下的稳定传输。思考:数字信号的“ 离散性”是如何从原理上消除模拟信号常见的“ 沙沙”杂音 的?知识点2: 数字信号贵州大数据中心海量苗绣纹样被编码为0/1数据流 ,在此安全存储与高速计算。低电平 (0)高电平 (1)数字信号仅含0和1两种离散状态(对应高低电平),小幅干扰不会改变电平的“0/1属性”;而模拟信号是连续渐变的,任何外界干扰都会直接叠加到原信号上,形成杂音。对比维度 信号形态 模拟信号 (Analog) 连续波形,无断点 离散脉冲,仅0/1状态 物理本质 物理量随时间连续变化 高低电平切换 (High/Low) 抗干扰性 弱 (易受噪点叠加影响) 强 (易区分0/1状态) 传输质量 随距离衰减,放大伴随噪音 可无损再生 ,长距离稳定 存储难度 难 (易失真,如磁带消磁) 易 (二进制存储,便于复制) 贵州案例 老式有线广播 磁带录制苗歌5G文旅传输思考与探究贵州山区地形复杂,信号传输极易受到山体阻挡和环境噪音干扰。结合表格中的“抗干扰性”和“传输质量”,谈谈为什么数字信号更适合作为贵州现代通信的主流选择?数字信号 (Digital)信号深度对比表大数据中心山区地形会加剧模拟信号的衰减和干扰,导致通信质量差;数字信号抗干扰强、传输距离远,且易通过编码校验修正错误,更适配山区复杂的通信环境。θ1θ1机器语言图解:从可读的文字符号经过编码标准的 “翻译齿轮 ” ,转化为计算机可存储的二进制流。编码的本质 计算机底层电路只能识别 “开 ”与 “关 ”(即 0 和 1 ) 。 文字编码的核心需求是建立“人类符号 ”与“机器二进 制”之间严格的 一一对应映射关系 。思考时刻为什么必须是 “一一对应 ”的映射?如果同一个二进制代码对应两个不同的汉字,数据传输会发生什么后果?单字节编码英文、数字、符号Example: ASCII双字节编码汉字、复杂字符Example: GBK/Unicode知识点3: 文字编码字人类符号计算机处理编码转换映射规则二进制化若一个文字对应多个二进制码,或一个二进制码对应多个文字,计算机无法准确识别和存储信息,会出现 “乱码”,“一一对应” 是编码互通的基础。文字编码1: ASCII码深解(单字节)ASCII 码定义ASCII (American Standard Code for Information Interchange) 是基于拉丁字母的一套贵州本土案例:拼音 "GUI" 解码G Dec: 71U Dec: 85I Dec: 73细节分类0-31 控制字符不可见 ,如换行(LF)、 回车(CR)、退格(BS)32-127 可显示字符空格、数字(0-9)、大小写字母、标点符号数值范围0 ~ 127θ1θθθ111θ1θ1θ1θ1θ1θθ1θθ1电脑编码系统。编码长度7位二进制字符总数个2查表获值对照ASCII码表查找十进制数值1拆分拼音将中文名字转换为标准拼音并拆解3转二进制将十进制数值转换为8位机器码试一试:解码你的名字 按照上述步骤 ,查询你名字拼音首字母的编码。L76I73b 01001100b 01001001 例:李LI → L, IASCII码实操: 查询名字拼音编码在此写下拼音在此计算二进制7376汉字编码拆解示意:高位与低位GB2312 国标码收录6763个常用汉字。采用高字节和低字节编码 ,且最高位均为1 ,以区别于ASCII码。GBK 扩展规范收录21003个汉字。重点解决了少数民族生僻字(如人名、地名中的特殊汉字)无法输入的难题。Unicode 统一码全球通用标准 ,解决多语言乱码问题。贵州大数据中心数据存储通常采用此标准以保障兼容性。汉字示例高字节 (High Byte) 低字节 (Low Byte)对应十六进制: B1 F9 (GBK编码)注:最高位为1 ,区别于ASCII (0xxxxxxx)深度思考为什么英文编码仅需1个字节 ,而汉字编码必须使用2个甚至更多字节?这体现了信息 的什么特征?为什么需要双字节? ASCII码仅能表示128个字符 ,无法覆盖数万个汉字。 汉字编码采用双字节( 16位)结构 ,通过 “ 高位+低位” 组合实现海量字符映射。文字编码2:汉字编码深解(双字节)1θ11θθθ111111θθ1苗010203+ASCII码用7位二进制可表示128种字符,能覆盖英文、数字和符号;而汉字数量庞大(仅GB2312就收录6763个常用汉字),1个字节(8位)最多表示256种字符,无法满足需求,因此汉字编码需2个字节(16位),可表示65536种组合。核心作用: 设备互通的基石编码标准如同语言语法 ,是实现不同设备(手机、服务器、物联网终端) 间数据互通的前提。贵州政务系统与大数据中心之间的数据共享 ,必须依赖统一的编码标准 ,避免出现“ 乱码” 现象。GBKUnicode万国码 ,统—全球字符。解决多语言环境下的乱 码冲突 ,大数据中心首选。兼容GB2312 ,大幅扩展字库。 收录 “ 苗” 、 “侗” 等少数民族生僻字 ,适合本土应用。 深度思考 最优标准选择 若贵州大数据中心需要建立一个包含中文、英文、侗语等多语言的非遗数据库 ,你会优先选择哪种编码标准?为什么?贵州大数据中心数据融合在存储全省文旅数据时 , 由于涉及中文、英文及少数民族语言 ,系统统一采用 UTF-8 (Unicode) 标准 ,确保数据在任意终端都能精准显 。US ASCII单字节编码 ,仅包含英文大小写、数字与控制符 号。 范围有限。GB2312双字节编码 ,收录6763个常用简体汉字 ,满足基 础中文需求。编码标准的包容性Unicode > GBK > GB2312 (兼容关系)兼容性文字编码标准深解本土关键扩展性Q-01 SIGNAL TYPE Q-02 ASCII CODEQ-03 CHINESE CHAR在GBK编码标准中 ,存储“贵州”两 个汉字 ,至少需要多少个字节?A 2 BytesB 3 BytesC 4 BytesD 8 Bytes下列波形描述中 ,哪一项符合模拟信 号的特征? A 仅包含0和1两种状态 B 抗干扰能力极强 C 随时间连续变化的物理量 D 易于计算机直接存储 已知字母 'A' 的 ASCII 码是 65 , 则字母 'C' 的二进制编码是多少? A θ1θθ θθθ1 B θ1θθ θθ1θ C θ1θθ θθ11 D θ1θθ θ1θθ课堂小测(第1课时) 限时:5分钟请根据所学知识完成下列挑战。提示: A -> B -> C (递增)贵州文字编码 ASCII码 (单字节) 0-127范围,覆盖英文/数字/符号 汉字编码 (双字节) GB2312/GBK,高位为1区别于ASCII编码标准 核心作用 实现设备互通,消除信息孤岛 Unicode (万国码) 全球统一标准,解决多语言乱码信号分类模拟信号 (Analog)特征:连续、渐变、易衰减数字信号 (Digital)特征:离散、脉冲、抗干扰课后思考回顾本节课,你解锁了哪些 “文字编码密码 ”?尝试用自己的 话总结ASCII码与汉字编码的区别。数据编码知识体系第1课时核心回顾第1课时小结① 编码是文字与二进制的“翻译规则”;② ASCII码适配英文,汉字需双字节编码;③ 统一编码标准是数据互通的关键;④ 编码与贵州多语言数据存储、政务互通密切相关。放大观察像素点任务二:聆听声音起伏 行动指南 闭眼聆听一段苗族飞歌 ,感受声音的高低变化与强弱起伏。 思考方向 声音是连续波动的 ,计算机如何用 “ 0” 和 “ 1” 来记录这种高低起 伏?任务一:观察图像细节行动指南用手机拍摄一张苗寨照片并不断放大 ,直到看清画面由一个个色彩 方格组成。感受声波起伏思考方向为什么照片放大后会出现 “ 马赛克” ?这些方格是如何记录颜色的?行动指南聆听苗族飞歌,猜测 “声音的高低起伏如何用编码表示”?课后预习任务揭秘:位图与像素像素 (Pixel):构成数字图像的最小单位,即那些小方格。位图 (Bitmap):由像素阵列组成的图像。每个像素的颜 色信息都被编码为二进制数据。现象:放大的锯齿当我们把精美的苗绣照片无限放大时 ,原本平滑的线条会变成一个个颜色各异的小方格, 图像边缘出现明显的 “锯齿 ”现象。课前思考上一节课我们学习了文字如何编码为0和1,那么这些五颜六色的像素点,计算机又是如何将它们转化为二进制进行存储的呢?第2课时导入: 苗绣照片放大谜题10×10 像素矩阵细节θ1θ11θθ1 111θθθ1θ1θ1θ1θ1θ11θ1θθ1θ θθ1θ11θ1 1111θθθθ1θ1θ1θ1111θ1θ1θ1 θθθ1θθ1θθ/1位图微观视角如同苗绣由一针一线组成 ,位图图像由一个个携带颜色信息的 “像 素” 网格构成。 计算机通过记录每个网格的二进制数值来存储图像。位图 (Bitmap) :最小单位为光栅点(或称像素),因而也叫点阵图(像素图)。每个像素由深浅不同的颜色,像素越多,排列越紧密,图像就越清晰。用数码相机拍摄的照片、扫描仪扫描的图片以及计算机截屏图等都属于位图。知识点4: 图像编码在满足一定保真度的条件下,对图像数据进行变换、编码和压缩,以较少比特数表示图像或图像中所包含的信息的技术。矢量图:用直线和曲线描述图形,数据量小,图形放大或缩小不失真,但色彩不丰富。放大后的位图和矢量图位图采用位映射存储格式,即将每一个像素映射为一个数据,存放在以字节为单位的矩阵中。位图文件大小位图文件大小: 在计算机二进制数系统中,每个0或1就是一个位(bit,数据存储的最小单位),8个 位就称为一个字节(Byte)。黑白图像,每一个像素有2种可选颜色(黑、白),称为1位图像。图中所包含的图形数据为6×16÷8=12个字节图像存储量公式B (Byte) ÷1024 ÷1024 ÷1024实际计算中注意单位统一分辨率: 水平像素 × 垂直像素 (如 1920×1080)位深: 即量化位数,如 24bit (真彩色), 8bit (灰度)位图文件存储量计算(公式推导+应用)核心逻辑:为什么要 ÷ 8 计算机基础存储基本单位是 Byte (字节),而传输速率或原始参数常用1 Byte = 8 bitsMBKBGBbit (位)。1bit 黑白图像 (Black & White)最基础的图像形式,像素仅有黑(1)与白(0)两种状态。无法表现色彩层次,常用于二维码或简单纹样。8bit 灰度图像 (Grayscale)包含256个等级。0代表纯黑,255代表纯白,中间数值对应不同深浅的灰色,能细腻表现苗绣照片的光影质感。深度思考已知苗绣常用的“靛蓝色”RGB数值为 (R=0, G=127, B=255)。请推导其对应的24位二进制编码是多少?RGB数值: R=255, G=0, B=0二进制码 : 11111111 θθθθθθθθ θθθθθθθθ24bit 真彩色图像 (True Color / RGB)通过R(红)、G(绿)、 B(蓝)三通道各8bit混合,组合出1677万种颜色。位图编码深解:颜色映射逻辑视觉原理: RGB三原色光叠加苗绣红纹支持动画GIF 图形交换格式编码逻辑:基于LZW算法 ,仅支持256色(8bit)索引 颜色。文件特点:支持多帧动画 ,背景透明 ,色彩有限。本土应用: 制作苗绣纹样动态演 图标。无压缩BMP 位图格式编码逻辑: 直接映射存储像素颜色信息 ,无数据压 缩。文件特点:体积巨大 ,保留原始细节 ,无失真。 四 本土应用: 苗绣数字化采集的原始素材归档。JPG 联合图像专家组编码逻辑:利用人眼视觉特性 ,丢弃不敏感颜色信 息。文件特点:体积小巧 ,适合网络传输 ,色彩丰富。本土应用: 贵州文旅官网展 景点照片 ,节省流 量。思考问题 如果要将高清的苗绣展品照片上传到贵州数字博物馆 ,既要保证细节清晰供专家研究 ,又要考虑服务器存储成本 ,你会优先选择哪种格式?为什么?常见图像格式编码差异有损压缩选JPG格式。BMP格式无压缩,文件过大,加载速度慢;JPG是有损压缩格式,会丢弃人眼不敏感的颜色信息,在保证展品清晰度的前提下大幅减小文件体积,适配官网“省流量、快加载”的需求。从苗歌飞歌到二进制数据在贵州苗寨录制非遗飞歌时 ,麦克风捕捉的是连续变化的模拟信号(Analog Signal)。计算机无法直接处理连续的声波 ,必须通过模数转换(A/D)将其转化为离散的数字信号。这一过程主要包含采样、量化和编码三个核心步骤。就是把输入的模拟信号按适当的时间间隔得到各个时刻的样本值,使其转换为时间上离散、幅度上连续的脉冲信号。关键参数:采样频率(如CD音质 44.1kHz)是把样值信号的无限多个可能的取值,近似地用有限个数的数值来表示。关键参数:量化位数(如16bit = 65536级)将量化后的采样值十进制用二进制数码表示,并转换为由二进制编码0和1组成的数字信号,形成计算机可存储的文件。最终结果:二进制流 (01011010...)知识点5:声音编码(声波的数字化三步骤)采样 (Sampling)编码 (Encoding)31奈奎斯特采样定理示意图表1-4 声音信号的数据编码2量化 (Quantization)深度思考 为什么采样频率越高、量化位数越多,还原的苗歌音质越好?这会对文件存储大小产生什么影响?声道数 声音通道的数量。双声道立体声可还原声音在空间中 的方位感。本土应用对比: 双声道:还原苗寨对歌现场方位 单声道: 简单的语音播报通知 量化位数 (bit) 记录每个采样点振幅的二进制位数。位数越多 ,声音 的强弱动态范围越大。本土应用对比: 16bit: CD级音质 ,保留苗歌细节 8bit: 电话音质 ,会有明显底噪 采样频率 (Hz) 每秒截取声波样本的次数。频率越高 ,还原的波形越 平滑 ,声音越真实。本土应用对比: 44.1kHz: 苗歌非遗录制(高保真) 22.05kHz:语音导航(省流量)声音编码声音存储量公式 文件大小 (Byte) =8采样频率 (Hz) 量化位数 (bit)声道数 (1或2) 时长 (秒/s)频率 × 量化位数 × 声道 × 时间① 采样频率越高,每秒采集的声音样本越密集,能保留更多苗歌的细节(如高音、颤音);② 量化位数越多(如16bit vs 8bit),采样值的等级划分越细,能还原更丰富的声音动态范围,失真越小,音质越接近原声。音频数据编码 从模拟声波到数字文件的转换 文件大小对比 (3分钟苗歌)WAV FLAC MP3 思考:如果要建立 “ 贵州非遗苗歌数字档案” 供后人研究,WAV 无压缩 体积最大完整记录所有采样数据 ,无任何损耗。如同胶片相机的原始底片 ,保留一切细 节。FLAC体积最小丢弃人耳不敏感的高频声音以大幅减小体积。如同图片的缩略图 ,便于传输。体积中等利用算法压缩数据但解压后可完美还原。如同文件的压缩包 ,兼顾音质与体积。本土应用:文旅短视频快速传播(手机播放)本土应用: 非遗官网高品质下载(研究专用)本土应用: 贵州非遗馆母带存档(永久保存)常见音频格式编码差异MP3 有损压缩无损压缩苗绣数字化探索地图基础关:黑白位图 Easy田对象:苗绣纹样扫描图参数: 1024×768像素, 1bit(黑白)避坑指南:易错点总结 时间单位需统一转换为“秒”(3min = 180s) 最终结果除以8(bit 转 Byte) 注意单位换算 (1MB = 1024KB)挑战关:真彩色照片(含压缩) Hard对象:苗绣真彩色JPG照片参数: 800×600像素, 24bit,压缩比1:10进阶关:苗歌WAV音频 Medium对象:苗族飞歌非遗录音-Lr参数:44.1kHz , 16bit,双声道,时长3分钟求实际存储大小 (KB) 求文件大小 (MB) 求文件大小 (KB) 存储量计算闯关(分难度)智慧体验云游贵州的极速加载智慧旅游平台通过图像压缩编码算法 (如WebP格 式) ,在保持画质的前提下大幅降低文件体积 ,让游 客即使在移动网络下也能秒开全景VR ,体验沉浸式云 游。技术应用逻辑原始影像 → 压缩编码 → 带宽优化 → 极速呈现数据存储非遗苗绣的数字化永生贵州大数据中心利用高效编码格式(如无损FLAC音 频 、 高保真JPG/RAW图像) ,将超过10万幅珍贵苗 绣纹样与苗歌转化为二进制数据 ,实现非遗文化的永 久保存与毫秒级检索。信号传输山区数据的精准传输针对贵州复杂的喀斯特地形 , 5G通信采用先进的信道 编码技术(如Polar码) 和奇偶校验机制 ,有效抵抗 山体遮挡带来的信号衰减与干扰 ,保障偏远苗寨数据 实时上传。技术应用逻辑实体纹样 → 扫描编码 → 分布式存储 → 随时调用技术应用逻辑信号编码 → 校验纠错 → 抗干扰传输 → 完整接收知识点6: 编码的本土深度应用题目一: 图像编码题目三:存储计算题目二: 声音数字化 答案解析 1.采样 2.量化 时间离散 幅度离散 正确顺序:③ → ① → ②3.编码二进制映射Q:计算一段 10秒、44.1kHz、 16位、双 声道的无压缩音频文件大小(单位:KB)。公式提 : 大小 = 采样频率 × 量化位数 × 声道 数 × 时间 /8Q:请将模拟声音信号转换为数字信号的 三个核心步骤按正确顺序排列:答案解析选 B。 量化位数( Bit Depth)决定了每个像素能表 的颜色数量。例如 8bit 支持 256 色 ,24bit 支持真彩色(约1678万色)。分辨率决定清晰度。课堂小测(第2课时)本测验旨在检测对图像参数 声音编码流程及存储计算的掌握程度答案解析代入公式计算:② 编码③ 采样① 量化转换为 KB (除以 1024):答案:约 1722.7 KBQ:下列关于位图参数的描述 ,哪项直接 决定了图像的颜色丰富程度?A 分辨率BB 量化位数C 文件格式4. 贵州本土落地苗绣纹样数字化永久存储大数据中心海量数据管理智慧旅游5G高效传输数字信号离散脉冲(0/1)、抗干扰强、易存储 (现代通信)模拟信号连续变化、易衰减、易受干扰(如 老式广播)图像公式分辨率 × 量化位数 / 8声音公式采样率 × 位数 × 声道 × 时间 / 8核心思考2课时学完,你能完整说出 “苗绣从拍摄到存储的编码流程 ” 吗?整体知识点小结( 2课时)声音编码 (三步骤)①采样 (时间离散) ②量化 (数值离散) ③编码文字编码ASCII (单字节) GBK/Unicode (双字节/多语言)图像编码位图(像素) 颜色映射(RGB) 量化位数2. 编码核心原理1. 信号基础3. 存储量计算A前沿技术:量子叠加态传统比特(Bit)只能表示0或1,而量子比特(Qubit)可以处于 叠加态,同时表示多种状态。这种指数级的算力增长,能轻松处 理海量非遗数据。本土畅想:苗绣3D数字永生利用量子编码的高维特性,存储苗绣复杂的3D纹理与光影细节, 突破传统存储瓶颈,实现真正的 “毫发毕现 ”与永久保真。拓展延伸:量子编码与非遗保护从二进制的0和1到量子比特的叠加态,编码技术的每一次飞跃,都为非遗文化的数字化保护带来了无限可能。思维发散除了存储,你认为量子编码强大的计算能力还能为贵州非遗保护做些什么? (例如:复原残损纹样、跨时空虚拟展示等)QUANTUM & HERITAGE当最古老的苗绣纹样遇见最前沿的量子比特,数据让非遗跨越时空。基础巩固 必做任务 核心知识点复习 通过选择题与填空题形式 ,巩固编码类型、核心参数 与国际标准等基础知识。重点回顾ASCII码与汉字编 码的字节差异。 编码类型辨析 常用标准记忆 能力提升 选做任务 存储量计算挑战 结合苗绣高清照片与苗歌音频参数 ,进行实际文件大 小的计算。强化对公式 的理解与应用。 图像容量估算 音频参数换算 本土实操 选做任务 文旅编码方案设计 为贵州特色文旅项目设计一套完整的数字化编码方 案。包含景点名称编码、宣传图格式选择及背景音乐 参数设定。 多媒体综合应用 创新方案展示课后作业预告症状:非遗苗歌存 MP3 还是 FLAC? 选择困难" 我想把苗歌永久保存下来,但也想发朋友圈,选哪个? "二进制 主治医师专治各种编码疑难杂症处方:记得除以 8!公式算出的是 bit (位) ,文件单位是 Byte (字节)。1Byte= 8bits,所以8,000,000bits÷8 = 1,000,000Byte≈1 MB处方:按需服用。存档保护:选 FLAC (无损压缩),音质不丢失。网络分享:选 MP3 (有损压缩),体积小传得快。处方:适度即可 ,拒绝参数内卷。人耳听力极限约 20kHz,根据奈奎斯特采样定理,44.1kHz 已足够覆盖人耳范围。过高参数只会徒增存储压力,对 听感提升有限。症状:采样频率越高越好吗? 参数焦虑" 我把采样率设到 96kHz ,文件变得巨巨大,有必要吗? "今日公告:请各位同学携带好 “草稿纸 ”和 “计算器 ”有序排队问 诊。症状:存储量计算结果对不上?" 医生,我按公式算出来是 800万,怎么文件才 1MB? "答疑环节:编码困惑诊所编码专科门诊 常见误区让非遗可永久存储, 让数据可高效传递解码贵州 · 课程圆满结束 展开更多...... 收起↑ 资源列表 1.2 数据编码 - 配套教案(2课时)粤教版(2019)信息技术必修1.docx 1.2 数据编码 分层作业(含答案解析·2课时完整版)粤教版(2019)信息技术必修1.docx 1.2 数据编码:解码贵州——从苗绣纹样到大数据的二进制密码 粤教版(2019)信息技术必修1.pptx