第4章多媒体数据压缩基础课件(共46张PPT)- 《多媒体技术与应用》同步教学（清华大学版）

资源简介

(共46张PPT)
第4章多媒体数据压缩基础
4.1 压缩技术概述
4.2 常用编码方法介绍
数据压缩的重要性
在多媒体计算机系统中，计算机所面临的不再是简单的数值，而是数值、文字、图形、视频、音频等多种媒体元素，并且要将它们数字化、存储和传输，其数据量很大比如：
1、采样频率为44.1kHz，用16位采样、立体声，未压缩前的存储量176KB。650MB的CD-ROM可存大约1小时的音乐。
2、一分辨率640×480的真彩色图像，每帧的数据量为922KB,若每秒25帧，则每秒数据量为23MB,则一片CD-ROM只能存10多秒的图像。
多媒体信息的计算机表示
一、图像数据量的计算方法
影响图像数据量的相关因素：
1、图像的象素数目（分辨率）
2、颜色深度（颜色数量）
图像数据量的计算公式：
S＝分辨率*颜色深度/8
多媒体信息的计算机表示
二、音频信号数据量的计算方法
影响音频信号数据量的相关因素：
1、音频信号的采样频率
2、采集音频信号的声道数
3、采样声音的二进制位数
4、采样时间
音频信号数据量：
S＝采样频率*声道数*量化位数*采样时间/8
信息的传输方式：
通信方式的改变文字+语音图像+文字+语音
通信对象的改变人与人人与机器，机器与机器
由于通信方式和通信对象的改变带来的最大问题是：
传输带宽、速度、存储器容量的限制。
这给我们带来的一个难题，也给了我们一个机会：
如何用软件的手段来解决硬件上的物理极限。
数据冗余的概念
你的妻子，Helen，将于明天晚上6点零5分在上海的虹桥机场接你。
(23*2+10=56个半角字符)
你的妻子将于明天晚上 6点零5分在虹桥机场接你。
(20*2+3=43个半角字符）
Helen将于明晚6点在虹桥接你。
(10*2+7=27个半角字符）
图像中的数据冗余的概念
描述语言 1、“这是一幅 2*2的图像，图像的第一个像素是红的，第二个像素是红的，第三个像素是红的，第四个像素是红的”。
2、“这是一幅2*2的图象，整幅图都是红色的”。
由此我们知道，整理图像的描述方法可以达到压缩的目的。
图像冗余无损压缩的原理
RGB RGB RGB RGB
RGB RGB RGB RGB
RGB RGB RGB RGB
RGB RGB RGB RGB
16
RGB
从原来的16*3*8=284bits压缩为：(2+3)*8=40bits
图像冗余有损压缩的原理
36 35 34 34 34
34 34 32 34 34
33 37 30 34 34
34 34 34 34 34
34 35 34 34 31
34 34 34 34 34
34 34 34 34 34
34 34 34 34 34
34 34 34 34 34
34 34 34 34 34
25 34
数据压缩编码技术
一、多媒体的数据量、信息量和冗余量
1、数据：用来记录和传输信息的，是信息的载体。
2、冗余：是指信息存在的各种程度的多余度。
3、信息量与数据量的关系可以表示为：
数据量＝信息量+数据冗余
4、数据冗余的主要类型
1）空间冗余：在同一幅图像中，规则物体和规则背景的表面物体特性具有相关性，这些相关性的光成像结果在数字化图像中就表现为数据冗余。
2）时间冗余
3）信息熵冗余
4）结构冗余
5）知识冗余
6）视觉冗余
4、数据冗余的主要类型
1）空间冗余
2）时间冗余：时间冗余反应在视频帧序列中，相邻帧图
像之间有较大的相关性，一帧图像中的某
物体或场景可由其他帧图像中的物体或场
景重构出来。语音中也有大量的时间冗余。
3）信息熵冗余
4）结构冗余
5）知识冗余
6）视觉冗余
4、数据冗余的主要类型
1）空间冗余
2）时间冗余
3）信息熵冗余：又叫编码冗余，信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余。
信息熵（entropy）：指一团数据所带的信息量，平均信息量就是信息熵。
例如:从64个数中选出某一个数,可先问“是否大于32 ”消除半数的可能,这样只要6次就可选出某数。这是因为每提问一次都会得到1比特的信息量。因此，在64个数中选定某一数所需的信息量是 log2 64=6(bits) 。如果将信源所有可能事件的信息量进行平均，就得到了信息熵(entropy)。
4）结构冗余
5）知识冗余
6）视觉冗余
4、数据冗余的主要类型
1）空间冗余
2）时间冗余
3）信息熵冗余
4）结构冗余：数字化图像中物体表面纹理等结构往往存
在着数据冗余，这种冗余称为结构冗余。
5）知识冗余
6）视觉冗余
4、数据冗余的主要类型
1）空间冗余
2）时间冗余
3）信息熵冗余
4）结构冗余
5）知识冗余：由图像的记录方式与人对图像的知识之间
的差异所产生的冗余称为知识冗余。人对
许多图像的理解与人的某些知识有很大的
相关性。
6）视觉冗余
4、数据冗余的主要类型
1）空间冗余
2）时间冗余
3）信息熵冗余
4）结构冗余
5）知识冗余
6）视觉冗余：人类的视觉系统由于受生理特性的限制，
对于图像场的注意是非均匀的，人眼并不
能察觉图像场的所有变化。

习题：
填空题：
1. 一个图片背景中有很大区域颜色均匀，这种冗余属于_______。图像表面有明显纹理结构，着属于_____冗余。图像序列中的两幅相邻图像，后一幅图像与前一幅图像之间有较大的相关，这是_____。
2. 按能否完全恢复数据，将数据压缩方法分为______和______。
二. 简答题
1、一幅分辨率为1024*768点阵的彩色图像，
图像的颜色数量为256色，求这幅图像在
计算机中的数据量？
2、如果采样频率为22.05khz， 32位，双声道
的音频文件，长度为10秒，声音文件的大
小为多少？
3、信息量和数据量有什么关系？举出至少5种数据冗余的类型。
4、衡量数据压缩技术好坏的指标是什么？
三、数据压缩方法
1、按解码后数据与原始数据的一致性分类
可以大致分为无损压缩和有损压缩两大类。
　　无损压缩利用数据的统计冗余(如各种形式的重复)进行压缩，使用元损压缩可完全恢复原始数据而不引入任何误差或失真，但压缩率受到数据冗余理论的限制，一般为2：1到5：1。
这类方法广泛用于原始数据的存档，如文本数据、程序和创作图像等。由于压缩比的限制，仅使用无损压缩方法不可能完全解决声音、图像和数字视频的存储和传输问题。　　多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方法如Huffman编码、算术编码等等。
有损压缩
方法利用了人类视觉和听觉器官对图像或声音中的某些频率成份不敏感的特性．允许在压缩过程中损失一定的信息量。有损压缩的数据虽然不能完全恢复原来的面貌，但是所损失的部分对理解原始图像或声音的影响较小，却换来了大得多的压缩比。
有损压缩广泛应用于语音、图像和视频数据的压缩，如JPEG(静态图像压缩标准 )和MPEG（视频和音频压缩标准）。
三、数据压缩算法的综合评价指标
衡量一种数据压缩技术好坏的指标综合起来就是：
1、压缩比要大
2、实现压缩的算法要简单、压缩与解压的速度要快
3、恢复效果要好
1、压缩的倍数
压缩的倍数也称压缩率或压缩比，通常有
两种衡量的方法：
1）由压缩前与压缩后的总的数据量之比来表示。（或
者也可是压缩过程中输入数据量和输出数据量之比，希望压
缩比尽量的大）。
2）将任何非压缩算法产生的效果（如降低分辨率、帧
率等）排除在外，用压缩后的比特流中每个显示象素的平均
比特数 bpdp（bit per displayed pixel）来表示。
2、图像质量
当使用无损压缩时，不用担心损失原始的图像信息，所以对无损系统不必担心图像的质量。
有损压缩则要对原始图像做一些改变，这些压缩前后图像不完全相同，可是人眼难以察觉，对有损压缩结果的评价分为：
1）主观评分
2）客观尺度
主观评分建立在人眼对图像的视觉感观上
表1 主观评分法项目
妨碍尺度质量尺度
5、丝毫看不出图像的好坏 5、非常好
4、能够看出图像质量变化，但不妨碍观看 4、好
3、清楚的看出图像质量的变坏，对观看稍有妨碍 3、一般
2、对观看有妨碍 2、差
1、非常严重的妨碍观看 1、非常差
■ 客观尺度通常用以下三种指标表示
1）均方误差； 2）信噪比（SNR）；
3）峰值信噪比（PSNR）
3、压缩与解压的速度
目标是使压缩与解压的速度尽量的快。
在许多应用中，压缩和解压将在不同的时间，不同的地点、不同的系统中进行，因而必须分别评价压缩和解压速度。
行程编码(RLE编码)
行程编码：
基本原理：将一行中颜色值相同的相邻像素用一个计数值和该颜色值来代替。
举例说明： aaaa bbb cc d eeeee fffffff
(共22*8=176 bits)
4a3b2c1d5e7f (共12*8=96 bits)
行程编码（RLE，Run-length encoding）是一种非常简单的数据压缩编码形式。它基于简单的编码数据原则，这个原则就是，重复的数据值序列（或称为“流”）用一个重复次数和单个数据值来代替。这里，重复的值称为一个“连续”（run）。一种常用的格式是由一个控制符、一个重复次数字节和一个被重复的字符构成的3字节码词，格式为：
控制符重复次数被重复字符
例如，字符串
RTAAAASDEEEEE 经RLE压缩后为：
RT*4ASD*5E
在这里“*4A” 代替了“AAAA”，“*5E” 代替“EEEEE”。其中，控制符采用特殊字符’*’ 指出一个RLE编码的开始，后面的数字表示重复的次数，数字后的单个字符是被重复的字符。显然，重复字符数为4或大于4，RLE编码效率才高，因为一个重复至少需要3个符号来表示。
哈夫曼（Huffman）编码
哈夫曼（Huffman）在1952年提出一种编码方法，即从下到上的编码方法。
哈夫曼码的码长是可变的，且不需要另外附加同步代码。
哈夫曼编码有几个问题需要注意：
哈夫曼码没有错误保护功能；
哈夫曼码是可变长度码，因此很难查找或调用压缩文件中间的内容
接受端需保存一个与发送端相同的哈夫曼码表
3）哈夫曼（Huffman）编码
哈夫曼算法创建一种哈夫曼编码的步骤：
将信源符号按概率递减顺序排列；
把两个最小概率加起来，作为新符号的概率；
重复前面的步骤，直到概率和达到 1 为止；
在每次合并消息时，将被合并的消息赋以 1 和 0，或 0 和 1；
寻找每个信源符号到概率为 1 处的路径，或者从概率为 1 到每个信源符号的路径，记录路径上的 1 和 0；
对每个符号写出 1 和 0 的序列,即为Huffman编码。
3）哈夫曼（Huffman）编码
定理：对于给定的 m 个权值，算法 Huffman 构造
的m个外节点的增长树具有最小的加权通
路长度。
这种Huffman提出的最佳变长码的编码法，一般情况下编码效率比其他编码方法的效率高，是最佳变长码。但是Huffman码依赖于信源的统计特性，必须统计得到心愿的概率特性才能编码，这就限制了实际的应用。
【例】离散无记忆信源:
对应的
平均码长为：
压缩比为：2/1.75=1.14
0.5*1+0.25*2+0.125*3+0.125*3
=1.75
例题：
有这样一段数据，由A、B、C、D、E几个字母组成，ABAEADDECEBADECAEBDE，原来的编码就是A：000；B：001；C：010；D：100；E：101，下面用哈夫曼编码，将这些字母重新编码，看是否有压缩。
步骤：
1、计算各个字母出现的频率；
2、按照哈夫曼编码进行重新编码；
3、计算重新编码后与以前编码所形成数据量的对比。
例2：设有5个符号信源X={X1，X2，X3，X4，X5}，若其概率分布P=P（Xi）{0.40，0.2，0.2，0.1，0.1}，则霍夫曼编码的平均码字长度为多少？压缩比多大？
练习题：
1. 设有7个符号的信源X={X1，X2，X3，X4，X5，X6，X7}，若其概率分布为P={0.20，0.19，0.18，0.17，0.15，0.10，0.01}，采用霍夫曼编码的平均码字长度为多少？压缩比为多少？
2. 利用行程编码将下列信源进行压缩：RTTTTTTTTABBBCCD
设有5个符号的信源X={X1，X2，X3，X4，X5，}，若其概率分布为P={0.16，0.51，0.09，0.13，0.11}，采用霍夫曼编码的平均码字长度为多少？
现代压缩技术
混合编码实现的可能性及有效性：
回顾一下讲过的几个内容的特点
1. 行程编码：擅长于重复数字的压缩。
2. Huffman编码：擅长于像素个数的不同编码。

展开更多......

收起↑

请用微信扫码

第4章 多媒体数据压缩基础 课件(共46张PPT)- 《多媒体技术与应用》同步教学（清华大学版）

第4章 多媒体数据压缩基础 课件(共46张PPT)- 《多媒体技术与应用》同步教学（清华大学版）

第4章多媒体数据压缩基础课件(共46张PPT)- 《多媒体技术与应用》同步教学（清华大学版）

第4章多媒体数据压缩基础课件(共46张PPT)- 《多媒体技术与应用》同步教学（清华大学版）