资源简介 (共53张PPT)第一章内容复习数据PART1感知数据数据、信息与知识一 数据1.定义:是对客观事物的符号表示。2.类型:数字、图像、图形、字母、文字、视频、音频3.特征:数据和关于数据的解释是密不可分的,单纯的数据是没有意义的。人类对数据的利用一定程度上依赖于载体科学研究离不开数据,数据的客观性为科学研究提供了可靠的依据人们在利用数据的同时,自身也在产生数据二 信息1.定义:信息自古就有,目前没有统一定义。定义1:信息是用来消除随机不确定的东西。定义2:信息是数据经过存储、分析及其解释后所产生的意义。定义3:信息是物质存在的一种方式、形态、或运动状态,也是事物的一种普遍属性。二 信息2.特性:载体依附性信息是不能独立存在的,必须依附于一定的载体。同一信息也可以依附于不同的载体(《xx日报》、《租房合同》)时效性(天气预报、台风路径……)共享性信息是可以共享的,也可以被重复利用。与物质和能源不同的是,信息不会因为被别人获取而发生损耗。可加工处理性、真伪性(情报、互联网信息……)价值性显性价值、隐性价值,对不同人的价值不同二 信息具体实例:通过社交软件向大家宣传某商品高德地图在导航时实时播报路况“狼来了”的故事获取敌方进攻情报,并提前做好防御古时传递信息的烽火共享性时效性可加工处理性、真伪性价值性载体依附性三 知识1.定义:人类在社会实践中所获得的认识和经验的总和,包括对事实、信息的描述以及在教育中和实践中获得的技能2.特性:知识的获得,是人利用自身已有的信息进行加工,进而将新的信息纳入自己的知识结构的过程知识的来源有很多知识可以继承和传递接收同样的信息不同人所构建的知识不同四 智慧1.定义:智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对知识发展的前瞻性看法五 关系1.数据是对客观事物属性的描述,具有客观性。信息是对数据的解释,是数据中包含的意义,是对数据进行加工的结果具有主观性。2.信息和知识的来源是数据,是以数据为载体而存在的。信息是经过加工的数据,知识是经过人类归纳整理和反复验证后而呈现的规律。同时,相应的知识又是加工数据、提炼信息的基础,能帮助人理解信息。五 关系数据 智慧 信息 知识练习1.下列关于数据、信息和知识的说法,正确的是()A. “以讹传讹”说明信息在共享的过程中会发生损耗B.信息是计算机科学诞生后产生的C.数据+背景=信息D.数据可以表示所有的事物C练习2.下列关于数据特征的说法,不正确的是( )A.科学研究离不开数据B.数据的表现形式是多样的,如图形、图像、音频、视频等C.数据自古就有,人们对数据的研究方式方法在不断改进D.知识是对信息的积累和记忆D练习3.下列关于信息和信息加工的说法,正确的是()A.我们收集来的信息是一种初始的、零乱的、孤立的信息,只有对这些信息进行分类和排序,才能有效的使用B.数字在被写下来的那一刻就已被赋予了明确的含义C.数据经过处理就能提高价值D.数据、信息、知识、智慧是逐渐倒退的概念,前者是后者的抽象与升华,后者是前者的基础与前提A练习×√√√√××PART2数据采集与编码一 数据采集1.数据采集方法与数据来源传统:直接观察与实验,人工方式现代:使用传感器获得自然信源的数据,通过网络爬虫获得网络数据,以机器为主2.模拟与数字信号信息可以用数字信号或模拟信号表达,数字和模拟信号是可以相互转化的是否连续 存在位置模拟信号数字信号连续不连续、离散自然界计算机二 数字化3.采样和量化采样:使用采样器,对模拟信号进行采样。对于同一模拟信号,采样时间间隔越小,采集到的样本数越多。每秒采集到的样本数叫做采样频率。量化:量化是指将信号的连续取值近似为有限个离散值的过程。三 数制4.数制数据在计算机内是以二进制方式存储和处理的。两个基本要素:基和权进制转化二进制转十进制十进制转二进制二进制转十六进制十六进制转二进制十进制转十六进制十六进制转十进制四 编码4.数制数制转换结论速记(1)若二进制数的末位为“0”(“1”),则该二进制数转换为十进制数一定是________(__________)。(2)十进制正整数n转换为二进制数,若去掉该二进制数末位的“0”(“1”),再转换为十进制数,则新数是 ( )。(3)若在十六进制数末尾加上一个0,形成一个新的十六进制数,则新数是原数的倍。(4)4位二进制数表示的最大十进制数是 D,最大十六进制数是 H。偶数奇数n/2n//21615F一 数据采集4.数制数据在计算机内是以二进制方式存储和处理的。进制标志(B、O、D、H)进制转化二进制转十进制10110、1101、1010111十进制转二进制56、27、13二进制转十六进制10110、1101、10101100十六进制转二进制19、2B、56十进制转十六进制56、27、30十六进制转十进制19、2B、56练习1.现有一个二进制数1011101,下列选项中,与此二进制数大小相等的是()A.46 DB.38 HC.105 OD. 5D HD练习2.将模拟信号转成数字信号,一般需要经过采样、量化和编码,下列说法不正确的是()A.图甲是模拟信号的采样过程B.数字信号在取值上是离散的、不连续的信号C.纵坐标划分得越细,量化就越精细,与实际数据就越接近,如图丙D.量化就是在纵坐标上进行划分,如图乙,然后将每个采样点用数据表示出来A练习3.下列关于采用和量化的说法,不正确的是( )A.其他条件一致的情况下,采样频率越高,声音越真实,自然B.每秒的采样样本数叫做采样频率,单位用赫兹C.量化位数是量化值的八进制数D.量化位数越大,精度越高,存储容量也越大C练习4.下列有关声音数字化的说法不正确的是( )A.通过麦克风将人声录入到电脑属于数模转换。B.将模拟声音数字化需要经过采样、量化、编码三个过程。C.量化值一般用二进制数表示,其二进制位数决定了量化的精度,也称作量化位数。D.时长为 1 分钟的双声道 wav 格式音频,已知采样频率为 44.1KHz,量化位数为 16bit,其所占存储空间约为 10MB。A练习5.下列有关信息数字化的说法正确的是( )A.数字信号永远无法完全代表对应的模拟信号。B.模拟信号的特点是离散的连续的。C.在计算机中,数字信号都是以16进制存储和表示的。D.信息可以用数字信号表达,也可以用模拟信号表达。D练习6.按位取反指二进制数每一位取反,即0变1,1变0。十六进制正整数n转换为二进制数,该二进制数共6位。下列说法正确的是()A.n的值必大于十进制数32B.若该进制数的末位为1,则十六进制数n+1一定是3位数C.将该二进制数首位去掉,所得的值是原来的一半D.将该二进制数按位取反,转换为十六进制数,与据n相加的结果必为3FHD练习×√√√××××PART3编码一 编码1.字符编码:(1)编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。解码是编码的逆过程。(2)常见的字符编码有ASCII、Unicode及各种汉字编码。①ASCII码:基本的ASCII码共有128个,用1个字节(Byte)中的低7位编码。二进制范围为00000000~0111111,即十六进制的00~7F。②汉字编码:汉字编码分为外码、交换码、机内码和字形码。汉字编码采用GB2312标准时,1个字符占2个字节。③不管哪种形式的数据,在计算机中都采用二进制数进行编码。(3)1TB= 1024GB; 1GB= 1024MB; 1MB= 1024KB; 1KB= 1024B; 1B=8bit。一 编码2.条形码、二维码:(1)条形码是将宽度不等的多个黑条(简称条)和白条(简称空),按照一定的编码规则排列,用以表达一组信息的图形标识符。(2)二维条码/二维码是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。(3)相对于一维的条形码,二维码的信息存储量更大,功能也更加强大。一 编码3.声音编码:(1)声音的保真度受到采样频率和量化位数的影响。(2)常见的声音文件类型有Wave、MP3、WMA等。(3)Wave格式音频文件的存储容量计算公式:存储容量=采样频率(Hz)x量化位数( bit)x声道数x时长(s)(单位:位)一 编码4.图像编码(1)数字图像包括矢量图形与位图图像。①矢量图形由指令集合或数学公式描述,色彩少,存储容量小,任意放大其清晰度不变。②位图图像通过像素点描述,色彩丰富,存储容量大,放大或缩小其清晰度会变化。一 编码(2)图像的量化值用二进制表示,其长度称为颜色的位深度。如256种颜色的图像的位深度为8位。(3)常见的图像文件格式有BMP、JPEG、GIF、PNG等。(4)未经压缩的图像文件存储容量计算公式:存储容量=总像素x颜色位深度(单位:位)一 编码(1)静态图像连续播放形成视频。PAL制式每秒显示25帧,NTSC制式每秒显示30帧。(2)视频的编码一般是指对视频进行压缩。常见的视频编码方式有MPEG-1、MPEG-2、MPEG-4等。(3)常见的视频编码有AVI、MOV、MP4、FLV(4)未经压缩的视频文件存储容量计算公式:存储容量=帧图像存储容量x帧频x播放时长(s)(单位:位)5.视频编码一 编码知识点速记:(1)如图所示, 使用UltraEdit软件查看字符的内码:所有字符共占8个字节,其中字符“1”、“2”、“A”、“b”是ASCII码, 每个字符占1个字节,其内码值均小于80H,是半角字符;字符“中”和“!”是GB2312编码,每个字符占2个字节,其内码值都大于等于A0H,是全角字符。一 编码知识点速记:(2)对应的大小写字母ASCII码之间十进制相差32D,十六进制之间相差20H。(3)计算颜色位深度(4)因为存在冗余,压缩后的图片容量和声音容量都不能用公式计算。练习1.下列关于数制与字符编码的描述,不正确的是 ( )A.用 x 位二进制数给 y 种不同的信息进行编码,必须满足 y<=2^xB.末位为 0 的任意十六进制正整数,转换为十进制数后一定是偶数C.二进制数 110110 转换成十六进制数是 36D.字符“9”内码用十六进制表示为 39,则“10”内码用十六进制表示为 3AD练习C2.利用 Photoshop 软件把一幅大小为 1280*1024 像素、颜色位数为 3 字节的 BMP 格式图像 存储为 JPG 格式,存储后容量是 240KB,则图像的压缩比约为( )A. 128∶1 B. 32∶1 C. 16∶1 D. 2∶13. 用 UltraEdit 软件,显示“中国 China”的字符内码,部分界面如图所示:下列说法正确的是( )A.上图中共有 5 个 ASCII 编码,4 个汉字编码B.将“中国”输入电脑,其输入码是唯一的C.上图字符“n”的内码用二进制码表示为01101110D.小写字母“j”对应的内码值为 70H练习C4.用 UltraEdit 软件观察“9 月开学季”这几个字符的内码,如图所示:则“10 月黄金周”这几个字符的内码可能是 ( )A.40 D4 C2 BB C6 BD F0 D6 DCB.3A D4 C2 BB C6 BD F0 D6 DCC.31 30 D4 C2 BB C6 BD F0 D6 DCD.31 30 D4 C2 BF AA D1 A7 BC BE练习C一 编码×√√√×√PART4数据管理与安全一 数据管理(1)数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程,其目的在于充分、有效地发挥数据的作用。(2)计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段。(3)数据一般以文件的形式存储,文件格式有:文本、图像、音频等。(4)计算机采用树形目录结构管理文件。Windows系统中,采用更为形象的文件夹管理文件。二 数据安全(1)威胁数据安全的因素:硬盘驱动器损坏、操作失误、黑客人侵、感染计算机病毒、遭受自然灾害等。(2)保护数据安全的三个层面。安全问题 层面 方法自然灾害等 存储数据的介质 磁盘阵列、数据备份、异地容灾等黑客入侵等 数据本身 数据加密(保密性)数据校验(完整性)恶意盗号等 个人安全意识 提高数据安全意识,增强法律意识,及时备份数据三 数据与大数据(1)大数据概念:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。(2)大数据特征:符合大数据概念的数据一般具有数据规模大、处理速度快、数据类型多、价值密度低四个特征。(3)大数据思维①大数据要分析的是全体数据,而不是抽样数据。②对于数据不再追求精确性,而是能够接受数据的混杂性。③不一定强调对事物因果关系的探求,而是更加注重它们的相关性。三 数据与大数据1.新浪微博用户每天发布、转发的信息有几亿条2.面向网民的实时竞价广告的推送方式需要以毫秒级的速度分析海量数据,进而实现互联网广告的精准推送3.网络时代的数据包括网络日志、音频、视频、图片、地理位置信息等4.一桩案件,警察通过翻找十年内某路段的所有监控信息,最终找到了部分有价值的监控数据数据体量大速度快数据类型多价值密度低三 数据与大数据(4)大数据对社会的影响①大数据让生活更便利。②大数据让决策更精准。③大数据带来新的就业需求。④大数据带来新的社会问题三 数据与大数据×√×√√√√√××√√1.下列说法正确的是 ( )A.数据管理和信息一样自古以来就有B.数据管理的目的是在于充分、有效发挥数据的作用C.数据管理已经经历了人工管理、文件管理、智能管理三个阶段D.数据管理就是对数据有效收集、存储、处理和应用的过程,因此不用借助其他设备练习B2.以下关于结构化数据、半结构化数据与非结构化数据说法错误的是 ( )A.结构化数据必须严格遵循数据格式与长度规范B.传统的数据库常用于处理结构化数据,很难处理半结构化与非结构化数据C.生活中常见的图片、文档、网页都属于非结构化数据D.半结构化数据介于结构化与非结构化之间,因此生活中最常见的数据为半结构化数据练习D3.关于大数据的特征,以下说法正确的是 ( )A.数据量大并不一定是大数据B.数据的产生速度很快,处理速度可以不用很快C.虽然大数据的数据类型很多,但是各种数据的格式还是基本一致的D.大数据之所以蕴含着巨大的价值,就是因为其发挥价值的数据量十分庞大练习ATHANKS 展开更多...... 收起↑ 资源预览