资源简介 (共22张PPT)数据编码计算机存储单位计算机中的所有数据都以二进制形式进行存储和处理。计算机中存储一个“0”或“1”占用一个二进制位,称为1比特(bit),比特是计算机存储数据的最小单位。8个二进制位组成一个字节(byte),字节是计算机中存储数据的基本单位。1比特(bit)1字节(byte)计算机存储单位存储单位 换算关系B(byte),字节 1B=8b(bit)KB(kilobyte),千字节 1kB=1024B=210BMB(megabyte),兆字节 1MB=1024KB=210KBGB(gigabyte),吉字节 1GB=1024MB=210MBTB(terabyte),太字节 1TB=1024GB=210GBPB(petabyte),拍字节 1PB=1024TB=210TBEB(exabyte),爱字节 1EB=1024PB=210PB计算机中常见的存储单位与换算关系字符编码字符是多种文字和符号的总称,是人和计算机交互过程中不可或缺的重要内容。Hello 你好 0123456789、 \ {} (), * $ % #@ ~ &文字字符数字字符特殊字符字符编码由于计算机只能识别二进制数据,所以在处理各种类型的字符数据时,需要将字符转换为计算机可以识别的二进制数据。计算机通过特定的字符编码来将字符转换为二进制数据。所谓字符编码,即人为地制定常见字符和二进制编码之间的一一对应关系,形成字符编码标准,以实现字符数据的处理。A01000001字符编码美国信息交换标准码(America Standard for Information Interchange,ASCII)编码标准是最早的字符编码标准。ASCII编码包括英文字母、数字和特殊字符,使用一个字节(8位)来表示一个字符。因为ASCII编码包含的字符不能显示其他语言的字符,为了支持显示更多字符,后来出现了其他的字符编码标准,如Unicode。Unicode可以表示几乎所有语言中的所有字符,包括英文、中文、日文、韩文等。我国目前常用的字符编码标准是GB18030-2005,是强制性国家标准,采用单字节、双字节和4字节的变长编码。除此之外,UTF-8也是我国广泛使用的字符编码标准。声音编码振幅时间声音是一种波。振幅反应声音响度的强弱频率反应声音音调的高低声音编码为什么微信语音和现实中说话的声音听起来不一样呢?模拟信号数字信号数字化声音编码声音数字化的基本方法是按照一定的时间间隔采集声波的振幅,并将其转换为二进制数序列。声音数字化的基本步骤是采样、量化和编码。声音编码采样:以相等的时间间隔来测得声音模拟信号的模拟量值,对其进行离散化提取。采样频率指每秒声音被测量的次数,以Hz(赫兹)为单位。例如,高保真音乐采样频率一般为44.1kHz,即每秒采样44100次。量化值采样采样频率越高,数字化后的声音质量越好,越接近原声。62.35910.571591412声音编码量化:将采样值变换到最接近的整数值,即用有限个数的数值近似地表示原来连续变化的值。量化值625910715量化91412图中共有 16 个量化级别(0 ~ 15),因此每个量化值可以用 4 位二进制数表示,即量化位数是4。量化位数越多,量化值就会越接近采样值,音频的精度就越高。声音编码编码:将量化值转换为二进制数据,形成二进制编码。量化值625910715采样量化样本序号 1 2 3 4 5 6 7 8 9 10量化值 6 2 5 9 10 7 9 15 14 12二进制编码 0110 0010 0101 1001 1010 0111 1001 1111 1110 1100编码91412声音存储容量音频所占的存储容量取决于采样频率、量化位数、声道数和时长,其计算公式为:音频所占的存储容量 = 采样频率 × 量化位数 × 声道数 × 时长 /8例 :一首时长为 100 s 的双声道音乐,采样频率为 44.1 kHz,量化位数为 16,计算该音乐的音频所占的存储容量。音频所占的存储容量 =44 100 ×16×2×100 /8=17640000 B=17640000/1024/1024 ≈ 17 MB图像编码一副图像可以看作由许多彩色或各种级别灰度的点组成的,这些点按横纵进行排列,被称为像素。图像的数字化也要经过采样、量化、编码三个步骤。图像编码采样即采集图像的像素点,采样质量的高低用图像分辨率来表示,也就是图像在水平和垂直方向上的像素数量,即“水平像素数×垂直像素数”750×500200×13350×33分辨率越高,图像质量越高图像编码量化:用数值来表示图像每个像素点的颜色。量化的重要参数是图像能够容纳的颜色总数,由图像的量化位数决定。量化位数:也叫做颜色深度,指图像中像素颜色所占的二进制位。比如图像中只有黑白两种颜色,用1个二进制位就能表示出图中的两种颜色,即该图像的颜色深度是1。图像编码量化位数:4量化位数:6量化位数:8常见的彩色图像颜色深度有 8 位、16 位、24 位和 32 位等,颜色深度为 n,能表示的颜色就有 2n 种。一般来说,颜色深度越大,图像的色彩就越丰富,图像占用的存储空间也就越大。图像编码编码:将图像上的每个像素都用相应的二进制颜色编码来表示。不同颜色深度的图像中,相同的颜色的二进制编码不同。比如在黑白图像中,白色用1位二进制表示,即白色的二进制编码为 1,但在颜色深度为8位的图像中,白色要用八位二进制来表示,即11111111。图像编码位图图像所占存储空间由该图像的水平像素数、垂直像素数以及颜色深度来决定,计算公式为:图像所占的存储容量=水平像素数×垂直像素数×颜色深度/8例:图像尺寸为 90×72 像素,颜色深度为 24 位,计算该图像所占的存储容量。图像所占的存储容量 =90×72×24/8=19440B=19440/1024 ≈ 19 KB图像和视频编码视频画面是由以一定的速度连续播放的一组静态图像形成的,这些静态图像被称为帧。当连续的图像变化超过 24 帧/s 时,根据视觉暂留原理,就会形成比较流畅的视频画面。通过智能手机、平板计算机和数字摄像机等设备可以直接录制数字视频。此外,通过视频采集卡的输入端口可以采集模拟视频信号,对其进行数字化处理后,就可生成数字视频文件。文件格式和文件压缩数据压缩:按照一定的编码规则对数据进行重新组合,以去除数据冗余以使文件更少地占用存储空间和缩短传输时间。数据压缩分为无损压缩和有损压缩,无损压缩指对压缩后的数据进行还原后,得到的数据与压缩前完全相同。有损压缩指在压缩过程中会损失一定的信息,压缩后的数据无法还原成压缩前的样子。常用的无损压缩算法主要有 DEFLATE、LZMA 等算法,可以形成以ZIP和7Z为主流格式的压缩文件。压缩后所生成的文件称为压缩包,可能只有原来文件的几分之一,甚至更小。压缩包中的数据可以用压缩软件还原,即恢复到原始状态,这个过程称为解压缩。常见音频文件格式常见视频文件格式常见图像文件格式WAV格式:无损压缩格式APE格式:无损压缩格式AMR格式:有损压缩格式MP3格式:有损压缩格式AVI格式:有损压缩格式WMV格式:有损压缩格式MP4格式:有损压缩格式BMP格式:无损压缩格式PNG格式:无损压缩格式GIF格式:无损压缩格式JPEG格式:有损压缩格式JPG格式:有损压缩格式文件格式和文件压缩 展开更多...... 收起↑ 资源预览