4.2.3MPEG-4音频编码-音频压缩编码方法 课件(共25张PPT)-《多媒体技术应用》同步教学(高教版)

资源下载
  1. 二一教育资源

4.2.3MPEG-4音频编码-音频压缩编码方法 课件(共25张PPT)-《多媒体技术应用》同步教学(高教版)

资源简介

(共25张PPT)
声音同文字一样是办公活动中最重要的信息形式,是人类进行信息交流的重要媒介之一。
随着声音处理技术的发展,计算机语音处理能力有了可喜的进展。现实所有声音已经完全立体多声道出现在计算机中;语音输入技术也在逐步的代替键盘输入文字信息;声音文件也可以方便快捷的进行编辑、修改、显示等处理;甚至完全靠计算机也能直接产生真实的音乐声……
this chapter
声音处理技术
contents
音频编码
音频压缩编码方法
本节内容
1.波形编码
2.子带编码
3.自适应变换编码
4.参数编码
5.混合编码
音频压缩编码方法的分类及典型代表
编码
信号系统如何把一定的信息内容包含在少量特定信号的排列组合之中 。
1.采用一定的格式来记录数字数据。
2.采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率。
音频信号编码按照压缩原理不同,分为波形编码、参数编码以及多种技术相互融合的编码形式 。
直接对音频信号的时域或频域波形按一定速率采样,然后将幅度样本分层量化,变换为数字代码,由波形数据产生一种重构信号。
编码系统源于信号原始样值,波形与原始声音波形尽可能地一致,保留了信号的细节变化和各种过渡特征。
一、波形编码
脉冲编码调制→差分脉冲编码调制→自适应差分脉冲编码调制
(PCM) (DPCM) (ADPCM)
子带编码(Sub-Band Coding , SBC)
自适应变换编码(Adaptive Transform Coding ,ATC)
波形编码类型
最简单的波形编码,仅仅是对输入信号进行采样和量化。
声音带宽受采样频率限制,采样频率与信号带宽的通过防失真滤波器进行匹配。
运用非均匀量化,对幅度大的输入信号采用大的量化间隔,幅度小的输入信号采用小的量化间隔,在满足量化精度要求的情况下用较少的位数来表示信号。
脉冲编码调制(PCM)
源于PCM,根据声音信号相邻采样值之间呈现明显的相关性,利用前一个采样样本估算下一个样本信号的幅度大小,形成预测值。
对预测的样本值与原始的样本值之差进行量化。
差分编码调制(DPCM)
如果样本的预测值与样本的实际值比较接近,它们之间的差值幅度的变化就比原始声音样本幅度值的变化小,因此量化这种差值信号时就可以用比较少的位数来表示差值。
差分编码调制(DPCM)
综合了根据输入信号幅度大小来改变量化阶大小的自适应特性和差分特性,核心思想是:
使用小的量化等级去量化小的差值,使用大的量化等级去量化大的差值。
自适应差分编码调制(ADPCM)
使用过去的采样样本值估算下一个采样样本的预测值,使实际样本值和预测值之间的差值总是最小。
属于依据感知特性的频域编码
将音频信号进行时间足够短的分段,通过分段块由时间域转变为频率域,利用带通滤波器(BPF)组把原始信号的频带分割为若干子频带。
二、子带编码(SBC)
音频信号
采样时钟
频率分布
f
采样块分割
n个BPF
对听觉感知比较重要的子频带,编码器分配比较多的位数来表示它们,对于其他的子带编码器就可以分配比较少的位数来表示。
由于各子带频率范围不同,通过对每个子频带中的音频信号运用不同采样频率和不同量化间隔的自适应控制。
在信道上传送时设置 m 路数字编码器,将各路子带的代码复合起来通过多路复用器输出子带编码数据。
将各路子带输出信号送到m路并联数字解码后同步相加,相加恢复为原始信号 。
分频段滤波器
子带量化编码器
合成解码器
变换编码是先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。
三、自适应变换编码(ATC)
音频信号大部分都是低频信号,在频域中信号的能量较集中,将时域信号变换到频域再进行采样、编码,那么可以肯定能够减少数据 。
变换编码最典型是应用离散余弦变换(DCT)或改进的离散余弦变换(DCT) 。
变换编码过程是将音频信号进行时间足够短的采样,通过采样块由时间域变换为频率域,采样块的作用相当于将连续的音频呈现在一个“窗口”进行处理。
在变换系统中,用于量化一组变换样值的比特总数是固定的, 所以选择变换的采样块(窗口)长度,就可以调整时域分辨率和编码压缩比,采用短的采样块能够提高时域分辨率,长的采样块能够获得较高的压缩比。
自适应的概念主要表现在配合声学心理模型,根据音频信号的特性进行采样块(窗口)长度切换,缓解时域分辨率与编码压缩比的冲突。
变换编码与子带变换都是针对一定的采样块进行工作,子带编码具有出色的时间分辨率,但频率分辨率差;而变换编码有出色的频率分辨率,但时间分辨率差。
首先根据不同的信号源,如语言信号、自然声音等形式建立特征模型,通过提取特征参数和编码处理,力图使重建的声音信号尽可能高的保持原声音的语意,但重建信号的波形同原声音信号的波形可能会有相当大的差别 。
四、参数编码
常用的特征参数有共振峰、线性预测系数、频带划分滤波器等。
参数编码技术可实现低速率的声音信号编码,比特率可压缩到2Kbit/s - 4.8Kbit/s ,但声音的质量只能达到中等,特别是自然度较低,仅适合语言语言的传递与表达。
参数编码
将波形编码和参量编码组合起来的编码形式。
克服了原有波形编码和参量编码的弱点,力图保持波形编码的高质量和参量编码的低速率,在4 - 16Kbit/s速率上能够得到高质量的合成声音信号。
五、混合编码
混合编码的基础是线性预测编码(LPC ),常用脉冲激励线性预测编码MPLPC )、规划脉冲激励线性预测编码(KPELPC)码本激励线性预测编码(CELPC)等编码方式 。

展开更多......

收起↑

资源预览