4.2.3MPEG-4音频编码-音频信号压缩基础 课件(共16张PPT)-《多媒体技术应用》同步教学(高教版)

资源下载
  1. 二一教育资源

4.2.3MPEG-4音频编码-音频信号压缩基础 课件(共16张PPT)-《多媒体技术应用》同步教学(高教版)

资源简介

(共16张PPT)
声音同文字一样是办公活动中最重要的信息形式,是人类进行信息交流的重要媒介之一。
随着声音处理技术的发展,计算机语音处理能力有了可喜的进展。现实所有声音已经完全立体多声道出现在计算机中;语音输入技术也在逐步的代替键盘输入文字信息;声音文件也可以方便快捷的进行编辑、修改、显示等处理;甚至完全靠计算机也能直接产生真实的音乐声……
this chapter
声音处理技术
contents
音频编码
音频信号压缩基础
本节内容
1.音频信号压缩编码的必要性
2.音频信号压缩编码的可能性
3. 时域冗余
4. 频域冗余
5. 听觉冗余
数字音频的质量取决于:采样频率和量化位数这两个参数,为了保真在时间变化方向上取样点尽量密,取样频率要高;在幅度取值上尽量细,量化比特率要高 ,直接的结果就是存储容量及传输信道容量要求的压力。
音频信号压缩编码的必要性
音频信号的传输率 = 取样频率* 样本的量化比特数*通道数
取样频率 = 44.1KHz
样本值的量化比特数 = 16
普通立体声的信号通道数 = 2
数字信号传输码流大约 1.4 M bit/s
一秒钟的数据量为1.4Mbit/(8/Byte)
达176.4 K Byte(字节),等于88200个汉字的数据量
数字音频的出现,是为了满足复制、存储、传输的需求,音频信号的数据量对于进行传输或存储形成巨大的压力。音频信号的压缩是在保证一定声音质量的条件下,尽可能以最小的数据率来表达和传送声音信息。
信号压缩过程是对采样、量化后的原始数字音频信号流运用适当的数字信号处理技术进行信号数据的处理,将音频信号中去除对人们感受信息影响可以忽略的成分,仅仅对有用的那部分音频信号进行编排,从而降低了参与编码的数据量。
数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余。
音频信号压缩编码的可能性
1.幅度分布的非均匀性
信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置。
时域冗余
时域冗余的表现形式
2.样值间的相关性
声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多。
3.信号周期的相关性
声音信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周期之间具有相关关系。
4.长时自我相关性
声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数。
5.静音
声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量。
1.长时功率谱密度的非均匀性
任何一种声音信息,在相当长的时间间隔内,功率分布在低频部分大于高频部分,功率谱具有明显的非平坦性,对于给定的频段而言,存在相应的冗余。
频域冗余的表现形式
频域冗余
2.语言特有的短时功率谱密度
语音信号在某些频率上会出现峰值,而在另一些频率上出现谷值,这些共振峰频率具有较大的能量,由它们决定了不同的语音特征,整个语言的功率谱以基音频率为基础,形成了向高次谐波递减的结构 。
根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型,将通过听觉领悟信息的复杂过程,包括接受信息,识别判断和理解信号内容等几个层次的心理活动,形成相应的连觉和意境。
由此构成声音信息集合中的所以数据,并非对人耳辨别声音的强度、音调、方位都产生作用,形成听觉冗余。
由听觉冗余引出了降低数据率 ,实现更高效率的数字音频传输的可能 。
听觉冗余

展开更多......

收起↑

资源预览