资源简介 (共38张PPT)数据与信息数据、信息与知识大数据数据与信息的概念数据与信息的特征数据、信息与知识的关系大数据的概念大数据特征数值数据的编码文本数据的编码声音数据的编码图像数据的编码常用数制原码、反码、补码西文字符编码汉字编码Unicode采样量化编码采样量化编码编码数据与信息数据、信息与知识大数据数据与信息的概念数据与信息的特征数据、信息与知识的关系大数据的概念大数据特征数据是对客观事物属性的描述,是记录下来的某种可以识别的符号。信息是数据中所包含的意义,是对数据进行加工的结果。从数据到信息,再到知识,是一个低级到高级的认知过程。相同特征、不同特征、共同特征是指在无法可承受的时间范围内用常规软件工具进行数据、管理和处理的数据集合。数据量大处理速度快多样性价值性1、数据是现实世界原始事物现象的( ),是信息的载体。A、符号记录 B、还原 C、反映 D、提升学业评价2、人们在探索现实世界时,用( )记录自然现象与社会的发展,通过寻找其基本特征和规律,人们就能探索与揭示出自然和社会的发展规律。A. 文字 B. 图片 C. 数字 D. 数据3. 导航软件的实时路况信息会不断更新,这主要体现了信息具有( )。A. 真伪性 B. 时效性 C. 载体依附性 D. 可处理性数据与信息数值数据的编码文本数据的编码声音数据的编码图像数据的编码常用数制(二进制、十进制、八进制、十六进制)原码、反码、补码(正数、负数)西文字符编码(ASCII,基本ASCII码128个,扩展ASCII码128个汉字编码(GB2312,GBK,大GB)Unicode(世界上所有的文字和符号的编码)采样:每隔一段时间在模拟声音信号的波形上取一个幅度值。频率Hz量化:用二进制数表示采样所得到的幅度值的过程。编码:不同的编码方法得到不同的音频文件,如WAV、MP3采样:像素、图像的分辨量化:黑白量化位数1位、256色量化位数8位、真彩色量化位数24位编码:不同的编码方法得到不同的图像文件,如BMP、JPG、GIF、PNG编码十进制——二进制 除2取余 (25)10=( ?)2十进制——N进制 除N取余 (25)10=( ? )8(25)10=( ? )16二进制——十进制 按位权展开相加(20、21、22....) (01110)2=( ? )10N进制——十进制 按位权展开相加(80、81、82....) (160、161、162....) (116)8=( ? )10(11A)16=( ? )10八进制——十六进制 十六进制——八进制 用十进制作中间转换 (116)8=( ? )16(11A)16=( ? )8(+21)10=(+10101)2=(00010101)原=(00010101)反==(00010101)补(-21)10=(-10101)2=(10010101)原=(11101010)反=(11101011)补采样频率、量化位数、声道数、持续时间影响声音文件的大小图像分辨率、量化位数影响图像文件的大小(2022秋 宁波期末)下列有关信息的编码,描述正确的是( )A.最小的存储单位是位(bit)B.黑白图像的颜色位深度是2位C.基本的ASCII码共有127个,用1个字节中的低7位编码D.若某音频文件的量化位数为4位,则其量化值取值范围为0~3(2022海淀期末)下列关于信息与知识的描述,正确的是( )A.知识是信息加工后的产物B.知识与信息互不相关C.信息是知识提炼后的产物D.信息就是知识(2023浙江月考) 下列关于数据和信息的说法,正确的是( )A.数字就是数据,是数据唯一的表现形式B.信息会因为被别人获取而发生损耗C.计算机中数据一般以文件的形式存储D.大数据给生活带来便利的同时不会带来社会问题某停车场采用了无人值守停车收费系统,当车辆离场时,压到出口的地感线圈,地感线圈发射信号给卡口的高速摄像机,摄像机拍摄并通过软件识别车牌号,在出口终端显示器显示收款二维码,以及一些提示信息,如图所示。司机扫码支付后,道闸自动抬杆放行。下列关于数据与信息的说法,正确的是( )A.二维码是图形,不是数据B.图中的“10”仅是数字,不具有意义C.支付信息需在终端显示器显示,体现了信息的载体依附性D.通过软件对车牌图像进行识别转变成文本后,车牌信息会丢失火车作为中国交通运输的动脉,每年仅春运就承担了约10亿人次的运输。在互联网和移动终端普及的今天,通过网络购票成为了最佳选择。系统通过大数据技术,对购票的实时数据进行合理分析,精准调配列车运行车次。如图所示是小王使用12306APP查询车次信息的界面。下列关于数据与信息的说法,不正确的是( )A.图中“G173”是数据B.文字也是数据的一种表现形式C.列车信息不需要经过数字化就能存储到计算机中D.通过“耗时最短”对车次进行排序,说明信息具有可加工处理性数值数据编码(2022秋 杨浦区校级期末)我国目前已推出的汉字输入方式有数百种,如“牛”这个汉字,用全拼输入法,输入码为“niu”;用区位码输入法,输入码为“3703”;用五笔字输入法,输入码为“rhk”。以下叙述正确的是( )A.汉字内码一般用8个二进制位表示B.使用音码输入时重码率相比于使用区位码输入时要低,所以普通用户多采用音码进行输入C.同一个汉字,输入码可以不相同,但内码是相同的D.五笔字型输入法是字形码(2022秋 杨浦区校级期末)读书节将至,某高中计划设立图书漂流站,该校共有3个年级,每个年级各有6个班级,每个班级最多可捐赠的图书数量为100本,若仅遵循唯一性的原则为每本捐赠的图书设计编号(以二进制表示),下列叙述正确的是( )A.编号长度至少要10位 B.编号长度至少要11位C.编号长度至少要12位 D.编号长度至少要13位【答案】B【分析】本题主要考查信息编码。二进制数据也是采用位置计数法,其位权是以2为底的幂,二进制数从最右端第一位开始,其权的大小依次为20、21、22、23、24...的顺序。【解答】解:该校共有3个年级,每个年级各有6个班级,每个班级最多可捐赠的图书数量为100本,一共最多有3*6*100=1800本书,210=1024<1800<211=2048,因此编号长度至少要11位,所以选项B符合题意。故选:B。(2022秋 海淀区校级期末)若要表示30种不同的信号状态,至少需要的二进制位数是( )A.6 B.4 C.5 D.20【答案】C【分析】本题考查二进制。二进制数据也是采用位置计数法,其位权是以2为底的幂,二进制数从最右端第一位开始,其权的大小依次为20、21、22、23、24...的顺序。【解答】解:由于2^5=32,所以若要表示30种不同的信号状态,至少需要的二进制位数是5位,选项C符合题意。故选:C。(2022秋 黄山期末)某十字路口有四个车道,每车道用一个指示灯指明通行状态,下表是各指示灯的控制编码及对应的状态。若某一时段只允许车辆左转,但不允许车辆直行和右转,则此时的控制码应该是( )A.01111101 B.11111101C.11010101 D.01101101【分析】:若某一时段只允许车辆左转,但不允许车辆直行和右转,则左转为绿灯,两个直行为红灯,右转为红灯。此时的控制码应该是11010101,C正确。故答案为:C。 29班(2023 弥勒市校级学业考试)使用UltraEdit软件观察字符“我爱 Python!”的内码,部分界面如图所示下列说法正确的是( )A.字符“!”的内码占两个字节B.字符“爱”的十六进制编码是“AE 20”C.字符“h”的二进制编码是“01101000”D.字符“ON”的十六进制编码是“6F 6E”【分析】本题考查的知识点是计算机编码的相关知识。在使用UitraEdit软件查看字符内码时,得到的是十六进制数,全角字符如同汉字占用两个字节,半角字符占用一个字节(即ASCⅡ码),进行判断全角、半角字符及各个字符的内码值。【解答】解:ASCII码内码不大于7F,汉字内码占两个字节。由图中可知字符“!”的内码占一个字节,故选项A说法错误;字符“爱”的十六进制编码是“B0 AE”,故选项B说法错误;字符“h”的十六进制内码是“68”转二进制是“01101000”,故选项C的说法正确;小字符“on”的十六进制编码是“6F 6E”,故选项D说法错误。故选:C。 17班(2022秋 慈溪市期末)使用UltraEdit软件观察字符,部分界面如图所示。下列说法中正确的是( )A.图中共有4个ASCII字符B.字符“+”的十六进制内码是2B 33C.字符“2022”的十六进制内码是32 30 32 32D.字符“A“的内码用二进制表示是0100 0010本题考查的知识点是计算机编码的相关知识。在使用UitraEdit软件查看字符内码时,得到的是十六进制数,全角字符如同汉字占用两个字节,半角字符占用一个字节(即ASCⅡ码),进行判断全角、半角字符及各个字符的内码值。【解答】解:图中共有5个ASCII字符;字符“+”的十六进制内码是2B;字符“2022”的十六进制内码是32 30 32 32;字符“A“的内码为41,用二进制表示是0100 0001。故选:C。 17班 2班 12班(2023 云南学业考试)算式(1010)2+(3E)16的计算结果为( )A.(62)10 B.(68) 10C.(72) 10 D.(80) 10C【分析】本题考查的知识点是二进制的代码、数制的转化。其中B表示二进制,D表示十进制,H表示十六进制,二进制转化十进制整数部分为按权展开式法,十进制转化成二进制,整数部分为除2取余,小数部分为乘2取整,每一位十六进制数都可以用四位的二进制数来表示。【解答】解:(1010)2转换为十进制数为10,(3E)16转换为十进制数为48+14=62,所以题干中的结果为(72) 10,所以选项C符合题意。故选:C。 21班(2023 盘龙区校级学业考试)二进制111100(2)/二进制数11(2)的计算结果为十进制数( )A.30 B.29 C. 31 D. 20【分析】本题考查的知识点是二进制的代码、数制的转化。其中B表示二进制,D表示十进制,H表示十六进制,二进制转化十进制整数部分为按权展开式法,十进制转化成二进制,整数部分为除2取余,小数部分为乘2取整,每一位十六进制数都可以用四位的二进制数来表示。【解答】解:二进制转换为十进制采用位权展开相加,二进制111100(2)=1*2^5+1*2^4+1*2^3+1*2^2=60(10),二进制数11(2)=3(10),故二进制111100(2)/二进制数11(2)的计算结果为十进制数20。故选:D。(2022秋 五华区校级期末)已知英文字母m的ASCII码值为109,那么英文字母p的ASCII码值是( )A.112 B.113 C.111 D.114本题考查的是ASCII码表的相关知识。ASCII码表中第一部分是特殊字符,然后是数字、其次是大写字母最后时小写字母。所以按照码值从小到大排列,结果是数字、英文大写字母、英文小写字母。【解答】已知英文字母m的ASCII码值为109,根据字母表排列顺序为,m,n,o,p,那么英文字母p的ASCII码值是109+3=112。故选:A。(2022秋 慈溪市期末)一个时长为10秒、400×300像素,256色、NTSC制式(30帧/秒)的未经压缩的AVI格式无声视频文件,压缩为MP4格式后的文件大小约为600KB,则其压缩比约为( )A.48:1 B.60:1 C.1500:1 D.1800:1【分析】本题考查视频文件大小的计算【解答】解:256色为8位色,视频文件的大小的计算公式为:文件总字节=(画面尺寸×彩色位数(bit)×帧数)×时间/8(字节),所以文件存储容量=400×300×8×30×10÷8÷1024=35156.25KB,与600KB的比约为59:1,与B选项最接近。故选:B。已知字符“S”的ASCII码转化为十六进制数为53H,则可知字符“P”的ASCII码为( )A.01010000B.1010001C.01010010D.1001111【2022-2023学年上海市杨浦区复旦附中】小李在某声音编辑软件中录制了一段声音(软件录制界面如图所示),该段音频的数据量大约为( )KB。A.48000*16*2*5/1024/8 B.48000*2*16/1024/8C.1536*16/1024/1024 D.1536*16*2*5/1024/8【分析】本题考查的是音频文件大小计算。未压缩音频文件大小=采样频率(HZ)*量化位*时长*声道数/8(B)【解答】根据同时结合图形所提供的数据(双声道、时长为5秒)表示为:48000*16*2*5/1024/8,选项A符合题意。故选:A。【2022-2023学年上海市杨浦区复旦附中】小明设计了一个分辨率为524*512的logo,保存为24位图像logo1.bmp;随后,她在图①中增加了“Online Bee智能便利超市”的字样,不改变原有参数保存为logo2.bmp;为满足上传要求,她将图②转化为logo3.jpg。下列说法正确的是( )A.图像①的存储容量为786MBB.图像②中增加了文字,所以图像②比图像①大C.图像②③的分辨率相同,所以存储容量也相同D.图像①的存储容量比图像③大(2022秋 浦东新区校级期末)有金苹果logo如图所示,则每个像素至少需要______个二进制位表示。某软件用“每行相同颜色出现的次数+颜色名称”的方法进行压缩,如最后一行可表示成“1蓝9黑1蓝”,压缩后占24个二进制位,那么第一行压缩后最少占( )个字节。A.4 32 B.2 40 C.2 5 D.4 3【分析】本题主要考查二进制编码。二进制数据也是采用位置计数法,其位权是以2为底的幂,二进制数从最右端第一位开始,其权的大小依次为20、21、22、23、24...的顺序。【解答】解:一共有22=4种颜色,则每个像素至少需要2个二进制位表示。如最后一行可表示成“1蓝9黑1蓝”,压缩后占24个二进制位,即3个字节。第一行可表示成1蓝4黑1红4黑1蓝,则压缩后最少占5个字节。故选:C。(2022秋 杨浦区校级期末)如果用7位二进制数来表示整数,最高位用作符号位,其它位表示数值。例如:如此方式表示一个整数X,则X的取值范围是( )A.0≤X≤63 B.-63≤X≤63 C.-64≤X≤64 D.-63≤X≤0【分析】本题考查二进制。二进制数据也是采用位置计数法,其位权是以2为底的幂,二进制数从最右端第一位开始,其权的大小依次为20、21、22、23、24...的顺序。【解答】解:如此方式表示一个整数X,则X的取值范围是1111111~0111111,对应十进制数是-63~63,所以选项B符合题意。故选:B。(2022秋 徐汇区校级期末)酷酷需要对处理好的照片进行编码,照片由类型+编号两部分构成。如果类型最多有10种,每种类型的照片不超过60张。在尽可能减少编码长度的情况下,使用该编码方案保存的照片,以下说法正确的是( )A.用2位二进制数表示照片类型,5位二进制数表示照片编号B.用3位二进制数表示照片类型,6位二进制数表示照片编号C.用3位二进制数表示照片类型,5位二进制数表示照片编号D.用4位二进制数表示照片类型,6位二进制数表示照片编号【分析】本题考查二进制。二进制数据也是采用位置计数法,其位权是以2为底的幂,二进制数从最右端第一位开始,其权的大小依次为20、21、22、23、24...的顺序。【解答】解:如果类型最多有10种,则需要用4位二进制数表示照片类型,24=16>10;每种类型的照片不超过60张,则需要6位二进制数表示照片编号,26=64>60,故本题选D选项。故选:D。(2023春 上城区校级月考)将模拟信号转换成数字信号一般需要采样、量化与编码。下列说法正确的是( )A.采样点的量化值不同,其量化位数也一定不同B.对于同一模拟信号,采样的时间间隔越长,采集的样本数量越多C.改变量化等级,会影响采集的数据与实际数据的关系D.模拟信号采样后,再经过ADC在数值上进行离散化,经过编码转换成数字信号【分析】本题考查的是模拟信号与数字信号的转换。将模拟信号转换成数字信号一般需要采样、量化与编码。【解答】解:通过采样获得的样本需要进行量化,而量化位数也称为“量化精度”,是描述每个采样点样本值的二进制位数。采样位数和量化位数一样;对于同一模拟信号,传输频率相同,采样的时间间隔越小,采集到的信号样本数量越多;量化等级越多,所得图像层次越丰富,灰度分辨率越高,质量越好,但数据量大;模拟信号采样后,再经过ADC在数值上进行离散化,经过编码转换成数字信号,所以选项D说法正确。故选:D。(2022秋 乐清市校级期末)如图所示,这是一个汉字“方”的8×8信息编码图,只有黑白两种颜色,用数字“1”表示黑色方块,用数字“0”表示白色方块。图中第5行表示的二进制编码值转换成十进制编码值为( )A.68D B.34D C.35D D.26D【分析】本题考查的知识点是二进制的代码、数制的转化。其中B表示二进制,D表示十进制,H表示十六进制,二进制转化十进制整数部分为按权展开式法,十进制转化成二进制,整数部分为除2取余,小数部分为乘2取整,每一位十六进制数都可以用四位的二进制数来表示。【解答】解:用数字“1”表示黑色方块,用数字“0”表示白色方块,那么图中第5行代码00100010,转化为十进制数为34D。故选:B。字符编码标准 ASCII码7个二进制位表示,包括所有的大写和小写字母、数字0到9、标点符号,以及特殊控制符号。一个字节可以表示( )个不同的编码,可存储( )A 128 128个数字B.255 1个英文字母C.256 1位数字D.82个汉字小明使用高清扫描仪采集了一幅海报图像,分辨率为4096 2560,24位真彩色,理论上该图像未压缩时文件大小为( )MB。(4096 2560ⅹ24÷8)÷1024÷1024≈30MB二、图像编码下列4幅图均为220x120像素、24位位图的BMP图像,其存储容量下列说法正确的是( )A.图2容量最大 B.图3容量最大 C.图4容量最大 D.四张图一样大若一篇文章有256个汉字,每个汉字采用16x16点阵显示,所需的存储空间是( )A.1KBB.5KBC.8KB(正确答案)D.10KB若一篇文章有256个汉字,每个汉字采用16x16点阵显示,所需的存储空间是( )A.1KBB.5KBC.8KB(正确答案)D.10KB制作一段时长10秒,采样频率为22.05kHz 量化位数为8位的双声道立体声的WAV格式音频,需要的磁盘空间大约是( )A.215 KBB.430.7KBC.1.7MBD.42 MB一幅1024x768像素、24位色的BMP格式图像,不改变像素,将它更改为256色的BMP图像,其存储空间为原图的( )A.3/32B.32/3C.1/3D.3倍在微型计算机系统中,最常用的英文字符编码是( )A.国标码B.形码C.ASCII码D.音码数据压缩RLE(Run-Length Encoding,行程长度编码)是一种编码方式,也是一种简单的无损压缩法,压缩和解压缩效率高。RLE压缩法:利用控制字节的最高位来标识是否进行了压缩。当最高位为1时,则后面7位表示的是数据的重复次数;当最高位为0时,则后面7个位的数是被压缩的数据。例如,如果有15个十六进制数都是30,那么,压缩后的编码为8F 30。说明:十六进制数8F转换为二进制是10001111,最高位是1,后面的7位0001111表示字节的重复次数15;十六进制数30转换为二进制是00110000,最高位是0,30是被重复的数据。采取这种方法,一个字符只有重复两次以上,才能被压缩。即使一个数据只重复3次,也可以获得30%的压缩比。问题1:如果经过RLE方法压缩后的数据为8A 6F,那么解压缩前的数据是什么?问题2:根据RLE压缩方法,下列字符数据经过压缩后的数据是什么?20,30,30,30,35,35,…,35,64。其中,十六进制数30共有3个,35共有60个。 展开更多...... 收起↑ 资源预览