资源简介 (共20张PPT)数 字 音 频 技 术第二部分素材获取处理篇项目四音频(Audio)指人耳能听到的声音,数字音频技术是利用数字化手段对音频进行录制、存储、编辑、压缩或播放的技术。在我们的日常生活中,含数字音频的多媒体作品随处可见。下面就来学习数字音频技术的基础知识和应用。项目四 数字音频技术2任务一 了解音频基础知识在学习处理音频的具体方法前,需要先了解音频处理的一些基础知识,如声音相关概念,模拟音频和数字音频,以及常用的音频文件格式等。3项目四 数字音频技术一、声音相关概念4任务一 了解音频基础知识声音在物理学上被称为声波,它由物体振动产生,以波的形式在气体、液体或固体中传播,并能被人或动物的听觉器官感知,如图4-1所示。我们将振动发声的物体称为声源。项目四 数字音频技术图4-1 声音波形图振幅、周期与频率15任务一 了解音频基础知识项目四 数字音频技术振幅、周期与频率是声音的物理属性。在声音波形图上,人们把声波在振动过程中偏离平衡位置的最大距离称为振幅。振幅反应了声音能量的大小,振幅越大,声音越大。例如,击鼓的力量越大,对应声波的振幅就越大,发出的声音也就越大。周期是指两个相邻声波之间的时间长度,即重复出现的时间间隔,以秒(s)为单位。频率是指每秒钟声波的振动次数,它是周期的倒数,以赫兹(Hz)为单位。频率越高,声调越高,声音越尖;反之,频率越低,声调越低,声音越低沉。一般情况下,发声的物体越粗大松软,则所发声音的频率越低;反之,物体越细小紧硬,则所发声音的频率越高。声音按频率分类26任务一 了解音频基础知识项目四 数字音频技术声音按照其频率范围的不同,可分为次声(频率低于20 Hz)、超声(频率高于20 000 Hz)和可听声(频率为20~20 000 Hz)。可听声也称为音频,是指人耳能听到的声音。多媒体技术处理的声音主要是可听声。其中,人的说话声音是一种特殊的声音,其频率范围为300~3 400 Hz,称为语音。现实世界中的其他各种声音,如音乐声、风雨声、汽车声等,其频率范围为20~20 000 Hz,它们统称为全频带声音。具有单一频率的声音称为纯音,具有多种频率成分的声音称为复音。普通的声音(如人讲话和乐器演奏)一般都是复音。和谐的复音由基音和谐音所组成。基音的频率是和谐复音中的最低频(通常具有最大振幅),称为基频;谐音(也叫泛音)的频率是基频的整数倍,称为谐频。基频决定声音的音调,谐音则决定声音的音色。知识库声音的质量分级37任务一 了解音频基础知识项目四 数字音频技术声音的频率范围称为声音的带宽、频带或频域,它是声音的一项重要参数。带宽越大,声音信号强度的变化范围越大,声音效果也就越好。按照带宽可将声音质量分为如下4级。(1)“数字激光唱盘质量(10~22 050 Hz),通常又称为CD—DA质量,也就是常说的超高保真。(2)调频无线电广播质量(20~15 000 Hz),简称FM质量。(3)调幅无线电广播质量(50~7 000 Hz),简称AM质量。(4)电话质量(200~3 400 Hz)。声音三要素48任务一 了解音频基础知识项目四 数字音频技术除了前面介绍的振幅和频率这两个物理属性外,声音还有若干感知特性,它们是人对声音的主观反应。声音的感知特性主要有音调、响度和音色,称之为声音的三要素。音调: 人耳对声音高低的感觉称为音调或声调。它主要与声音的频率有关,频率越高,音调越高。9任务一 了解音频基础知识项目四 数字音频技术响度: 声音的响度是人耳对声音强弱的主观感知,即声音的大小,单位为dB(分贝)。人耳能感知的声音大小范围一般为0~120 dB。音色:音色是人们区别具有相同响度和音调的两个不同声音的主观感觉,也称为音品。例如,每个人讲话都有自己的音色;每种乐器都有各自的音色,即使它们演奏相同的曲调。音色主要是由复音中不同的谐音组成所决定的。声道510任务一 了解音频基础知识项目四 数字音频技术声道是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。早期的声音重放技术落后,只有单一声道;后来有了双声道的立体声技术,利用人耳的双耳效应,感受声音的纵深和宽度,使声音具有立体感;现在又有了多声道的环绕声重放技术(如4.1、5.1、6.1、7.1声道),将多只喇叭分布在听者的四周,建立起环绕听者周围的声音空间,使听者感受到自己被声音包围起来,具有强烈的现场感,如图4-2所示。图4-2 多声道环绕声重放效果二、音频数字化11任务一 了解音频基础知识人们在日常生活听到的各种声音都是模拟音频信号,它是一种连续信号,即在任何一个指定的时间范围里声音信号都有无穷多个幅值,如图4-3(a)所示。在数字音频技术出现之前,我们只能用磁带或胶木唱片来存储模拟音频信号。随着技术的发展,音频信号逐渐过渡到了数字化存储阶段,可以用计算机等设备将它们存储起来并处理。项目四 数字音频技术(a)连续的模拟音频信号图4-3 模拟音频信号的采样和量化12任务一 了解音频基础知识项目四 数字音频技术由于计算机只能存储和处理二进制数,所以在使用计算机存储和处理音频之前,必须使用模/数转换(A/D)技术将模拟音频转化为数字音频。目前,音频模数转换主要利用PCM(脉冲编码调制)技术实现,它包括采样、量化和编码三个步骤。提 示在计算机中播放声音是模/数转换(A/D)的逆过程,即将数字音频转换为模拟音频,称为数/模转换(D/A)。这些过程都是通过计算机的声卡来完成的。采样113任务一 了解音频基础知识项目四 数字音频技术采样就是每隔一定的时间间隔,抽取模拟音频信号的一个瞬时幅度值,从而把连续的模拟信号用一个个离散的点(离散信号)表示出来,如图4-3(b)所示。(b)采样图4-3 模拟音频信号的采样和量化每秒钟采样的次数称为采样频率,用f表示;样本之间的时间间隔称为取样周期,用T表示,T=1/f。例如,CD的采样频率为44 100 Hz,表示每秒钟采样44 100次。很显然,在对模拟音频信号进行采样时,采样频率越高,每秒钟采样的次数就越多,音质就越有保证;若采样频率不够高,声音就会产生失真。那么怎样才能避免低频失真呢?著名的奈奎斯特采样定理给出了明确的答案:采样频率不应低于声音信号最高频率的两倍。例如,电话话音的信号最高频率约为3 400 Hz,采样频率就应该≥6 800 Hz。量化214任务一 了解音频基础知识项目四 数字音频技术采样虽然取出了音频信号样本,但是每个样本声波幅度的大小需要用数字化的方法来反映。量化就是将采样后的离散信号用数值表示出来的过程。(c)量化图4-3 模拟音频信号的采样和量化量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋予相同的量化值,如图4-3(c)所示。量化时,用来表示将声波的幅度划分为多少个区段的二进制位数称为量化精度或量化位数,单位为bit,它反映了度量音频波形幅度的精度。15任务一 了解音频基础知识项目四 数字音频技术表4-1 不同音频品质的常用采样频率和量化精度量化精度的大小对音频的质量有很大的影响。在采样频率相同的情况下,量化精度越高,音频的质量越好,但需要的存储空间也越多。表4-1为不同音频品质的常用采样频率和量化精度。编码3模拟音频信号经过采样和量化以后,还需要进行编码才能形成可以在计算机中存储和处理的二进制数据,这样的数据称为数字音频。常见的音频编码有PCM、MP3、OGG等,我们将在后面具体讲解。品质级别 最高频率 采样频率 量化精度电话语音 3 400 Hz 6 800 Hz 8 bit接近FM电台 11 025 Hz 22 050 Hz 16 bitCD音频 22 050 Hz 44 100 Hz 16 bit标准DVD音频 24 000 Hz 48 000 Hz 24 bit蓝光DVD音频 48 000 Hz 96 000 Hz 32 bit三、常见的音频编码和文件格式16任务一 了解音频基础知识音频格式是指在计算机中存储音频文件的方式,采用不同编码的音频文件,其在计算机中的存储格式、文件大小和音质也不相同。下面介绍常见的音频编码和文件格式。项目四 数字音频技术PCM编码:即脉冲编码调制,指模拟音频信号经过采样、量化后直接形成数字音频,不进行任何压缩处理。采用PCM编码的音频优点是音质好,缺点是文件体积大。常见的WAV格式音频文件及Audio CD就采用了PCM编码。17任务一 了解音频基础知识项目四 数字音频技术WAV格式(*.wav):基于PCM编码的WAV格式是音质最好的音频文件格式。由于没有经过压缩处理,因此采用该格式的音频文件无论进行多少次剪辑都不会失真,而且处理速度也相对较快,特别适合保存音频素材。MP3格式(*.mp3):MP3格式的音频文件使用MP3(全称是MPEG-1 Audio Layer 3)或mp3PRO编码。MP3编码是目前最为普及的音频压缩编码,可以在12:1的压缩比下保持较高的音质;mp3PRO编码是对传统MP3编码技术的改良,它最大的特点是在低码率下保持非常高的音质。MP3格式还支持流技术,可以在线播放使用该格式的音频文件。18任务一 了解音频基础知识项目四 数字音频技术音频码率也叫比特率、数据率等,表示经过编码(压缩)后的音频每秒钟播放的数据量,单位是kbps(千位每秒)。音频码率=采样频率(Hz)×量化精度(bit)×声道数/8。例如,普通CD音频的采样率为4 4100 Hz,量化精度为16 bit,双声道,那么它的码率为4 4100 Hz×16 bit×2=1 411 200 bps=1378 kbps,即每秒播放1 378 kb的数据量。一般来说,音频码率越大,音质就越好,但音频文件的体积与码率大小是成正比的,所以几乎所有音频编码技术都重视如何用最低的码率达到声音的最少失真。目前,我们听的MP3歌曲码率大多数是128 kbps,也有64 kbps和256 kbps的。知识库WMA格式的音频文件使用Windows Media Audio编码,由微软开发,其压缩比可达到18∶1。WMA格式支持防复制、限制播放时间和播放次数等功能,从而防止盗版;WMA格式还支持流技术。OGG格式的音频文件使用Ogg Vorbis编码技术,它可以在相对较低的码率下实现比MP3更好的音质,但只被少数软件支持。WMA格式(*.wma):OGG格式(.ogg):19APE格式(.ape):APE格式的音频文件使用APE编码技术。APE编码是一种无损压缩音频编码,可以达到50%~70%的压缩率。任务一 了解音频基础知识项目四 数字音频技术WMA格式(*.wma):20任务一 了解音频基础知识项目四 数字音频技术MIDI音频MIDI是Musical Instrument Digital Interface(乐器数字接口)的缩写。MIDI音频与前面介绍的数字音频不同,它不是对声波进行采样、量化和编码,而是使用计算机将电子乐器键盘上的弹奏信息记录下来,当需要播放音频时,再从MIDI文件中读出MIDI消息,生成所需要的声音波形,经放大后由扬声器输出。MIDI音频具有如下特点:由于MIDI音频文件只是一系列记录按键信息的指令,不是波形数据的集合,因此它的体积比普通音频文件小,从而大大节省了存储空间。要使用MIDI音频,电脑声卡必须有硬件音序器或为电脑安装软件音序器。MIDI音频适于重现打击乐或一些电子乐器的声音,还可用计算机来作曲。知识库(1)(2)(3) 展开更多...... 收起↑ 资源预览