资源简介 (共69张PPT)第一章 数据与信息1.3数据采集与编码数据获取人工方式 观察实验传统采集方式纸、笔互联网物联网 网络 器件现代化的采集方式传感器、网络爬虫等::1.3.1数据采集计算机技术的应用,使得数据的处理方式发生了巨大的改变,数据的处理效率也得到了极大的提高。?思考:在视频中出现了哪些数据采集的方式?传感器获取来自自然信源的数据 。一种能感受被测量并按照一定的规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组成。小区入门车辆管理传感器?1、摄像头2、声音传感器3、重力感应器、陀螺仪4、光线传感器:根据光线强弱来改变屏幕亮度5、温度传感器6、磁场传感器:指南针、导航、记录运动速度、地理位置等等手机中有多少传感器?网络爬虫可在短时间内获取大量网络数据。网络爬虫也是通过网页中的超链接在网页间进行跳转,根据需求按获取某一方面的网页数据,然后用专门的软件进行处理分析。网络爬虫(网页蜘蛛)信号数据可用于表示任何信息,如符号、文字、语音、图像等。从表现形式上可归结为两类:模拟信号和数字信号,模拟信号与数字信号的区别可根据幅度取值是否离散来确定。1.3.2 数字化模拟信号数字信号模拟信号(Analog signal)以连续变化的物理量存在,如水银温度表呈现的温度值,电流表指针指向的电流值等。平时我们听到的声音、看到的电视图像都是模拟信号。模拟信号用电信号模拟自然界信号源发出的信号。数字信号(Discrete-time signal)取值上是离散的,不连续的信号。在信息技术中,这种信号表示的数据是指可被计算机存储、处理的二进制数据。人为抽象出来的在时间上的不连续信号,计算机中存储的信号。数字信号1100111010数字化——模拟信号转换为数字信号模数转换(A/D)模拟量数字量(可存储)电流电压声音声音文件话筒声卡采样、量化如将语音通过计算机的麦克风、声卡等设备存储在计算机中。模拟信号数字信号数字化从模拟信号转换到数字信号一般要经过采样、量化和编码这样三个过程,最终变成由一连串由0和1来代表的脉冲数字信号。模拟信号采 样量 化编 码模拟信号数字信号模数转换器ADC (数字化)数模转换器DAC文字 图片 视频 声音111001010101001101010101010010……二进制问题讨论既然计算机只能处理数字信号,那么是不是意味着不再需要模拟信号了?请结合生活实例进行说明练一练1.计算机中的数据是用( )表示的A.字母B. ASCII码C.二进制数字代码D.英文C练一练2.下列工具中不能把模拟图像转换成数字图像的是( )A.扫描仪B.数码相机C.智能手机D.打印机C练一练3. 不是将模拟音频数字化需要经过的步骤是( )A.采样 B.量化 C.编码 D.输入D练一练4.关于信息数字化的描述,错误的是( )A.可以利用扫描仪、照相机、手机等采集设备B.非数字化信息转化成数字信息,只需要经过采样、量化两个过程,无需要编码C.数字化是将非数字化信息要转化成二进制数字D.需通过数字设备存储和加工B十二十六除基倒取余商为零止按权展开相乘相加1位16进制=4位二进制8 4 2 1 法1.3.3 数制?小白鼠实验思考十进制(D) 二进制(B) 十六进制(H)0 0000 01 0001 12 0010 23 0011 34 0100 45 0101 56 0110 67 0111 78 1000 89 1001 910 1010 A11 1011 B12 1100 C13 1101 D14 1110 E15 1111 F智能手机在我们的日常生活中占的比重越来越多,甚至超过了我们的亲人、朋友。离开智能手机我们吃饭不方便、看电影不方便、骑共享单车不方便……这都取决于智能手机一个无敌的功能——扫码1.3.4 编码编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。生活中的编码:邮政编码、身份证、电话号码……计算机中的编码:字符编码 条形码 二维码声音编码 图像编码 视频编码数字信号11100101010100110101010101001010110100……二进制计算机存储的最小单位:二进制位110011101011100101010100110101010101001010110100……存储单位1个二进制数0或1:1bit (b、位、比特)计算机内的最小单位8个二进制数0或1:1Byte (B、字节)计算机存储的基本单位11 0 0 0 1 0 0 08b=1B0bBKBGB排一排MB>>>>1GB=1024MB=?KB= B= b1bit(比特、位、b )用来存储一位二进制数8b= 1B(Byte、字节)1024B=1KB1024KB=1MB1024MB=1GB1GB=1024MB=1024 KB=1024 B=1024 ×8b数字字母符号它们是如何转换成计算机能够识别的二进制?国际上普遍采用的西文字符编码是ASCII码(美国信息交换标准码)英文编码 ASCII码。常用的汉字编码有外码、交换码、机内码和字形码。ASCII码和汉字编码ASCII 码ASCII码从0到127,共128个代码。包含33个控制字符、10个阿拉伯数字、26个大写英文字母、26个小写英文字母与一些标点符号和运算符。彼此是按顺序排列的。最小: 0 00 000000 最大: 127 7F 01111111A和a的编码差多少?32653297空格的编码:A的编码:a的编码:十(D)0 0 0 0 0 0 0ASCII码二进制规则:n个二进制位最多能表示2n种不同的编码状态7个二进制位最多能表示27=128种不同的编码状态1 1 1 1 1 1 1——1字节ASCII码用一个字节的后7位来表示字符,最高位不用,一般为0。0 0 0 0 0 0 0 00 1 1 1 1 1 1 1ASCII码——1字节十六进制在一个伸手不见五指的白天,发生了一起命案,死者在死后留下了死亡信息 —— 一组十六进制的数,聪明的福尔摩胡老师发现这组密码竟然和ASCII码有关,请同学们一起破译密码!54 4F 4DASCII码(十)在一个伸手不见五指的白天,发生了一起命案,死者在死后留下了死亡信息 —— 一组十六进制的数,聪明的福尔摩胡老师发现这组密码竟然和ASCII码有关,请同学们一起破译密码!84 79 77T O MT O M84 79 77嫌疑犯是被逮捕了!汉字编码1 汉字外码(输入码)汉字输入汉字存储汉字显示汉字打印12332 处理码(机内码、内码)3 字形码4 区位码(交换码、国标码、GB2312-80)汉字传输41.输入码、外码向计算机输入汉字的方法有两类:一类是自动识别方式,包括汉字字形识别与语音自动识别;另一类就是进行输入码输入(又称外码输入)。输入码有拼音码、字形码。汉字输入法根据输入码分为很多种方式,如图a和图b所示的输入码分别属于( )图a 图bA.音码,形码 B.形码,音形码C.音码,形音码 D.形码,音码C汉字交换码(GB2312-80)又称国标码、区位码,全称为《信息交换用汉字编码及字符集》,由一张94×94的表格组成在计算机中,用第一个字节标记区码,第二个字节标记位码,因此,存储一个汉字字符需用两个字节。2.交换码在学习了“信息的编码”后,小陈对一些自己常用的QQ表情进行二进制编码练习,如图所示:若“ ”的二进制编码为“0100”,则“ ”的二进制编码为( )A.1110 B.1011 C.1001 D.011100 01 10 1100011011B计算机内部用于处理汉字信息的代码称为处理码,又称机内码、内码。汉字机内码由区位码的每个字节+常数160构成。需要注意的是ASCII码和Unicode码的交换码和处理码是统一的。3.处理码、机内码、内码你有吗F r e e S t y l e内码观察软件如用内码观察软件16进制显示“PC个人电脑”这几个字的内码:50 43 B8 F6 C8 CB B5 E7 C4 D4,问“个”字内码是什么?50 43 B8 F6 C8 CB B5 E7 C4 D4PC个人电脑为了字符的输出和打印,开发了字形码,俗称字体。常见的字形码有两种表示方式:点阵方式和矢量方式。标准字体(字形码)有黑体、宋体、仿宋体、隶书和楷体等五种。英文字符一般采用矢量方式表示,汉字一般采用点阵方式表示。4.字形码某字库采用点阵方式描述汉字字形,点阵规模为16×16,每个点用1个二进制位表示,“0”表示白点,“1”表示黑点,逐行编码。汉字“和”的字形如右图所示,下列描述正确的是 ( )A、该汉字字形编码需要16×16个字节B、该汉字字形第一行编码需要2个字节C、该汉字字形编码的第一个字节内容是OFHD、该汉字字形编码的最后一个字节内容是FFHB条形码条形码(barcode) 是将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。目前国际上有多种条形码编码方式,下图为我国普遍采用的EAN13条形码。二维码二维码(2-dimensional bar code) 是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。相对于一维的条形码,二维码的信息存储量更大,功能也更加强大。内容回顾【单位】一个ASCII码= 1( ) = 8 ( )一个GB2312= 2( )= 16 ( )1GB= MB= KB= B= b位字节字节位1024102421024310243×83.用软件查看字符的十六进制编码如图所示。以下说法正确的是( )A.“G20”是在全角状 态输入的B.“杭州”两字在存储时占4BC.“峰”字内码为1111011111 100101BD.“J”的十六进制编码是50B多媒体编码声音编码声音数字化过程将模拟声音数字化需要经过采样、量化、编码三个过程。声音的频率声音的频率一般以赫兹表示,记为Hz,指每秒周期性振动的次数。人耳可以感知到的声音,其频率范围在20-20000Hz。分贝分贝是用来表示声音强度的单位,记为dB。声音类型常见的声音文件类型有wave、mp3、wma等。声音容量=采样频率(Hz)*量化位数(bit)*声道数*时间(s)单位:位(bit)声音容量/8 :单位:(Byte 字节)声音容量=比特率(kbps)*时间(s)单位:位(kb)声音容量/8 :单位:KB数字图像包括位图图像与矢量图形。图形编码矢量图是指用点、直线或者多边形等基于数学方程的几何图元表示的图像,Flash软件绘制的图形为矢量图。常见的矢量图格式有:wmf、swf。位图又称栅格图像或点阵图,图像的采样就是把一张图像分解成一个一个大小相同的点,这些点称作像素,是组成位图的基本单位。画图、PhotoShop软件默认格式为位图。常见位图图像文件格式:如bmp、jpeg、gif、png等。位图层次、颜色丰富,放大后会失真。矢量图线条、颜色简单,放大后清晰度不会发生变化。1 0 1 0 11 0 1 0 01 1 0 1 11 0 1 0 10 1 0 1 03 3 3 3 3 3 3 33 2 2 2 2 2 2 33 2 1 1 1 1 2 33 2 1 0 0 1 2 33 2 1 0 0 1 2 33 2 1 1 1 1 2 33 2 2 2 2 2 2 33 3 3 3 3 3 3 311 11 11 11 11 11 11 1111 10 10 10 10 10 10 1111 10 01 01 01 01 10 1111 10 01 00 00 01 10 1111 10 01 00 00 01 10 1111 10 01 01 01 01 10 1111 10 10 10 10 10 10 1111 11 11 11 11 11 11 11?彩色图像位图色彩模式色彩模式黑白只有黑和白两种颜色(1位)灰度黑到白之间256级亮度(8位)RGB以红绿蓝为三原色构成其它颜色(三层颜色通道)十进制0~255表示每层颜色值(24位)RGB( , , ) 图像容量=水平分辨率*垂直分辨率*位深度(bit)单位:位(bit)图像容量/8 :单位:(Byte 字节)位图格式色彩模式单通道色彩位数(8*3=24位)缩放比例静态图像连续播放就形成视频视频编码视频存储量=每帧图像大小×帧频(fps)×时间(s)PAL制式每秒切换25幅画面:25帧每秒(25fps)NTSC制式每秒切换30幅画面:30帧每秒(30fps)常见的视频编码方式:MPEG-1、MPEG-2、MPEG-4;文件格式有:avi、mpg、mov、flv等。视频制式多媒体数据进行压缩的目的是为了节省存储空间,一般针对声音、图像、视频的压缩都属于有损压缩。rar、zip格式的文件都属于无损压缩格式。wav、bmp文件属于未压缩格式。多媒体数据压缩计算压缩比的方法是:压缩前容量/压缩后容量1024 * 700 * 2 * 8 / 8 / 1024=1400KB录制一段采样频率为2kHz,量化位数为4位,双声道的10秒的音乐,需要多大的存储空间(KB)?2000 * 4 * 2 * 10 / 8 / 1024 = 19.5 KB一幅1024 × 700像素的图像,每一个像素占用2个字节的存储空间,为了记录这幅图像所需的KB?1000 *500 * 8 / 8 * 25 * 10 / 1024 / 1024 = 119.2 MB录制10秒钟长的视频的分辨率为1000×500,每个像素最多能表示256种颜色的PAL制式的彩色视频存储容量是多少(MB)? 展开更多...... 收起↑ 资源预览