资源简介 (共46张PPT)第4章 多媒体数据压缩基础4.1 压缩技术概述4.2 常用编码方法介绍数据压缩的重要性在多媒体计算机系统中,计算机所面临的不再是简单的数值,而是数值、文字、图形、视频、音频等多种媒体元素,并且要将它们数字化、存储和传输,其数据量很大比如:1、采样频率为44.1kHz,用16位采样、立体声,未压缩前的存储量176KB。650MB的CD-ROM可存大约1小时的音乐。2、一分辨率640×480的真彩色图像,每帧的数据量为922KB,若每秒25帧,则每秒数据量为23MB,则一片CD-ROM只能存10多秒的图像。多媒体信息的计算机表示一、图像数据量的计算方法影响图像数据量的相关因素:1、图像的象素数目(分辨率)2、颜色深度(颜色数量)图像数据量的计算公式:S=分辨率*颜色深度/8多媒体信息的计算机表示二、音频信号数据量的计算方法影响音频信号数据量的相关因素:1、音频信号的采样频率2、采集音频信号的声道数3、采样声音的二进制位数4、采样时间音频信号数据量:S=采样频率*声道数*量化位数*采样时间/8信息的传输方式:通信方式的改变 文字+语音 图像+文字+语音通信对象的改变 人与人 人与机器,机器与机器由于通信方式和通信对象的改变带来的最大问题是:传输带宽、速度、存储器容量的限制。这给我们带来的一个难题,也给了我们一个机会:如何用软件的手段来解决硬件上的物理极限。数据冗余的概念你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。(23*2+10=56个半角字符)你的妻子将于明天晚上 6点零5分在虹桥机场接你。(20*2+3=43个半角字符)Helen将于明晚6点在虹桥接你。(10*2+7=27个半角字符)图像中的数据冗余的概念描述语言 1、“这是一幅 2*2的图像,图像的第一个像素是红的,第二个像素是红的,第三个像素是红的,第四个像素是红的”。2、“这是一幅2*2的图象,整幅图都是红色的”。由此我们知道,整理图像的描述方法可以达到压缩的目的。图像冗余无损压缩的原理RGB RGB RGB RGBRGB RGB RGB RGBRGB RGB RGB RGBRGB RGB RGB RGB16RGB从原来的16*3*8=284bits压缩为:(2+3)*8=40bits图像冗余有损压缩的原理36 35 34 34 3434 34 32 34 3433 37 30 34 3434 34 34 34 3434 35 34 34 3134 34 34 34 3434 34 34 34 3434 34 34 34 3434 34 34 34 3434 34 34 34 3425 34数据压缩编码技术一、多媒体的数据量、信息量和冗余量1、数据:用来记录和传输信息的,是信息的载体。2、冗余:是指信息存在的各种程度的多余度。3、信息量与数据量的关系可以表示为:数据量=信息量+数据冗余4、数据冗余的主要类型1)空间冗余:在同一幅图像中,规则物体和规则背景的 表面物体特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。2)时间冗余3)信息熵冗余4)结构冗余5)知识冗余6)视觉冗余4、数据冗余的主要类型1)空间冗余2)时间冗余:时间冗余反应在视频帧序列中,相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可由其他帧图像中的物体或场景重构出来。语音中也有大量的时间冗余。3)信息熵冗余4)结构冗余5)知识冗余6)视觉冗余4、数据冗余的主要类型1)空间冗余2)时间冗余3)信息熵冗余:又叫编码冗余,信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余。信息熵(entropy) :指一团数据所带的信息量,平均信息量就是信息熵。例如:从64个数中选出某一个数,可先问“是否大于32 ”消除半数的可能,这样只要6次就可选出某数。这是因为每提问一次都会得到1比特的信息量。因此,在64个数中选定某一数所需的信息量是 log2 64=6(bits) 。如果将信源所有可能事件的信息量进行平均,就得到了信息熵(entropy)。4)结构冗余5)知识冗余6)视觉冗余4、数据冗余的主要类型1)空间冗余2)时间冗余3)信息熵冗余4)结构冗余:数字化图像中物体表面纹理等结构往往存在着数据冗余,这种冗余称为结构冗余。5)知识冗余6)视觉冗余4、数据冗余的主要类型1)空间冗余2)时间冗余3)信息熵冗余4)结构冗余5)知识冗余:由图像的记录方式与人对图像的知识之间的差异所产生的冗余称为知识冗余。人对许多图像的理解与人的某些知识有很大的相关性。6)视觉冗余4、数据冗余的主要类型1)空间冗余2)时间冗余3)信息熵冗余4)结构冗余5)知识冗余6)视觉冗余:人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。 习题:填空题:1. 一个图片背景中有很大区域颜色均匀,这种冗余属于_______。图像表面有明显纹理结构,着属于_____冗余。图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是_____。2. 按能否完全恢复数据,将数据压缩方法分为______和______。二. 简答题1、一幅分辨率为1024*768点阵的彩色图像,图像的颜色数量为256色,求这幅图像在计算机中的数据量?2、如果采样频率为22.05khz, 32位,双声道的音频文件,长度为10秒,声音文件的大小为多少?3、信息量和数据量有什么关系?举出至少5种数据冗余的类型。4、衡量数据压缩技术好坏的指标是什么?三、数据压缩方法1、按解码后数据与原始数据的一致性分类可以大致分为无损压缩和有损压缩两大类。 无损压缩利用数据的统计冗余(如各种形式的重复)进行压缩,使用元损压缩可完全恢复原始数据而不引入任何误差或失真,但压缩率受到数据冗余理论的限制,一般为2:1到5:1。这类方法广泛用于原始数据的存档,如文本数据、程序和创作图像等。由于压缩比的限制,仅使用无损压缩方法不可能完全解决声音、图像和数字视频的存储和传输问题。 多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方法如Huffman编码、算术编码等等。有损压缩方法利用了人类视觉和听觉器官对图像或声音中的某些频率成份不敏感的特性.允许在压缩过程中损失一定的信息量。有损压缩的数据虽然不能完全恢复原来的面貌,但是所损失的部分对理解原始图像或声音的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩,如JPEG(静态图像压缩标准 )和MPEG(视频和音频压缩标准 )。三、数据压缩算法的综合评价指标衡量一种数据压缩技术好坏的指标综合起来就是:1、压缩比要大2、实现压缩的算法要简单、压缩与解压的速度要快3、恢复效果要好1、压缩的倍数压缩的倍数也称压缩率或压缩比,通常有两种衡量的方法:1)由压缩前与压缩后的总的数据量之比来表示。(或者也可是压缩过程中输入数据量和输出数据量之比,希望压缩比尽量的大)。2)将任何非压缩算法产生的效果(如降低分辨率、帧率等)排除在外,用压缩后的比特流中每个显示象素的平均比特数 bpdp(bit per displayed pixel)来表示。2、图像质量当使用无损压缩时,不用担心损失原始的图像信息,所以对无损系统不必担心图像的质量。有损压缩则要对原始图像做一些改变,这些压缩前后图像不完全相同,可是人眼难以察觉,对有损压缩结果的评价分为:1)主观评分2)客观尺度主观评分建立在人眼对图像的视觉感观上表1 主观评分法项目妨碍尺度 质量尺度5、丝毫看不出图像的好坏 5、非常好4、能够看出图像质量变化,但不妨碍观看 4、好3、清楚的看出图像质量的变坏,对观看稍有妨碍 3、一般2、对观看有妨碍 2、差1、非常严重的妨碍观看 1、非常差■ 客观尺度通常用以下三种指标表示1)均方误差; 2)信噪比(SNR);3)峰值信噪比(PSNR)3、压缩与解压的速度目标是使压缩与解压的速度尽量的快。在许多应用中,压缩和解压将在不同的时间,不同的地点、不同的系统中进行,因而必须分别评价压缩和解压速度。行程编码(RLE编码)行程编码:基本原理:将一行中颜色值相同的相邻像素用一个计数值和该颜色值来代替。举例说明: aaaa bbb cc d eeeee fffffff(共22*8=176 bits) 4a3b2c1d5e7f (共12*8=96 bits)行程编码(RLE,Run-length encoding)是一种非常简单的数据压缩编码形式。它基于简单的编码数据原则,这个原则就是,重复的数据值序列(或称为“流”)用一个重复次数和单个数据值来代替。这里,重复的值称为一个“连续”(run)。一种常用的格式是由一个控制符、一个重复次数字节和一个被重复的字符构成的3字节码词,格式为:控制符 重复次数 被重复字符例如,字符串 RTAAAASDEEEEE 经RLE压缩后为:RT*4ASD*5E在这里“*4A” 代替了“AAAA”,“*5E” 代替“EEEEE”。其中,控制符采用特殊字符’*’ 指出一个RLE编码的开始,后面的数字表示重复的次数,数字后的单个字符是被重复的字符。显然,重复字符数为4或大于4,RLE编码效率才高,因为一个重复至少需要3个符号来表示。哈夫曼(Huffman)编码哈夫曼(Huffman)在1952年提出一种编码方法,即从下到上的编码方法。哈夫曼码的码长是可变的,且不需要另外附加同步代码。哈夫曼编码有几个问题需要注意:哈夫曼码没有错误保护功能;哈夫曼码是可变长度码,因此很难查找或调用压缩文件中间的内容接受端需保存一个与发送端相同的哈夫曼码表3)哈夫曼(Huffman)编码哈夫曼算法创建一种哈夫曼编码的步骤:将信源符号按概率递减顺序排列;把两个最小概率加起来,作为新符号的概率;重复前面的步骤,直到概率和达到 1 为止;在每次合并消息时,将被合并的消息赋以 1 和 0,或 0 和 1;寻找每个信源符号到概率为 1 处的路径,或者从概率为 1 到每个信源符号的路径,记录路径上的 1 和 0;对每个符号写出 1 和 0 的序列,即为Huffman编码。3)哈夫曼(Huffman)编码定理:对于给定的 m 个权值,算法 Huffman 构造的m个外节点的增长树具有最小的加权通路长度。这种Huffman提出的最佳变长码的编码法,一般情况下编码效率比其他编码方法的效率高,是最佳变长码。但是Huffman码依赖于信源的统计特性,必须统计得到心愿的概率特性才能编码,这就限制了实际的应用。【例】 离散无记忆信源:对应的平均码长为:压缩比为:2/1.75=1.140.5*1+0.25*2+0.125*3+0.125*3=1.75例题:有这样一段数据,由A、B、C、D、E几个字母组成,ABAEADDECEBADECAEBDE,原来的编码就是A:000;B:001;C:010;D:100;E:101,下面用哈夫曼编码,将这些字母重新编码,看是否有压缩。步骤:1、计算各个字母出现的频率;2、按照哈夫曼编码进行重新编码;3、计算重新编码后与以前编码所形成数据量的对比。例2:设有5个符号信源X={X1,X2,X3,X4,X5},若其概率分布P=P(Xi){0.40,0.2,0.2,0.1,0.1},则霍夫曼编码的平均码字长度为多少?压缩比多大?练习题:1. 设有7个符号的信源X={X1,X2,X3,X4,X5,X6,X7}, 若其概率分布为P={0.20,0.19,0.18,0.17,0.15,0.10,0.01},采用霍夫曼编码的平均码字长度为多少?压缩比为多少?2. 利用行程编码将下列信源进行压缩:RTTTTTTTTABBBCCD设有5个符号的信源X={X1,X2,X3,X4,X5,}, 若其概率分布为P={0.16,0.51,0.09,0.13,0.11},采用霍夫曼编码的平均码字长度为多少?现代压缩技术混合编码实现的可能性及有效性:回顾一下讲过的几个内容的特点1. 行程编码:擅长于重复数字的压缩。2. Huffman编码:擅长于像素个数的不同编码。 展开更多...... 收起↑ 资源预览