资源简介 第 3 单 元 认识数据3.1数据编码编码是信息从一种形式或格式转换为另一种形式或格式的过程。计算机的编码是指用预先规定的方法将文字、数字或其他对象编成可以存储在计算机里的数值。1.模拟信号与数字信号按照取值特征,可以将信号分为模拟信号和数字信号。(1)模拟信号:其值被称为模拟数据,用传感器直接获得的信号,如声音、温度和压强等。特征:模拟信号的值是随时间而连续变化的,波形光滑。(2)数字信号:其值被称为数字数据,直接用计算机所能理解的二进制表示,方便计算机进行处理。特征:数字信号随时间的变化是非连续的,可以由模拟信号转换得来。2.声音的数字化声音的数字化:是指将模拟声音数据转换为数字数据的过程。将模拟声音数据转换为数字数据的过程:采样→量化→编码。3.二进制与数制转换计算机外部的各种形式的数据经过编码后,都以二进制的形式存储在计算机中。二进制数只有0和1这两个数字符号,其计数特点是“逢二进一”。计算机中存储数据的最小单位是二进制位,用比特(bit)表示。1比特能表示两种(21)状态(即0或1),2比特可以表示00、01、10、11四种(22)状态,3比特可表示八种(23)状态……计算机存储数据的基本单位是字节(Byte,简写为B),8比特构成1字节,1字节二进制数可表示28(256)种状态。在二进制数中,每一个数字在不同位置上具有不同的权值,各位上的权值是基数2的若干次幂,如二进制数10010,5个位置上的权值从右往左可以表示为: 20、21、22、23、24。将二进制转换为十进制数时,只要将二进制数的每位上的数字与其对应位置的权值相乘,然后求和即可。如10010(2) = 1×24+0×23+0×22+1×21+0×20 =18(10)。将十进制非负整数转换为二进制数,可使用短除法,即“除二取余”法。例如,把将十进制整数18转换为二进制的过程,方法如下:18(10)=10010(2)由于二进制数位数较多、书写不便,故常改用十六进制数表示。十六进制需要使用16个不同的基本数字,除了阿拉伯数字0到9外,一般用字母A到F(或a~f)依次表示后续数字(相当于十进制数中的10~15)。十六进制的基本计数规则是“逢十六进一”,即F+1=10。R进制(R≥2)非负整数转换成十进制数采用“按权展开求和法”。十进制非负整数转换成R进制数(R≥2)采用“除R取余法”。Python中的非十进制表示方式:二进制:用“0b”作为前缀,表示一个二进制数值。八进制:用“0o”作为前缀,表示一个八进制数值。十六进制:用“0x”作为前缀,表示一个十六进制数值。Python中的进制转换函数:bin():将一个整数转换为对应二进制数的函数。oct():将一个整数转换为对应八进制数的函数。int():根据一个字符串或浮点数创建一个新的整数的函数。hex():将一个整数转换为对应十六进制数的函数。4.文本数据的编码文本数据是用来表示一定意思的一系列字符,包括字母、数字、标点符号、汉字等。文本数据字符最为典型的两种编码方案是ASCII码和Unicode码。(1)ASCII码(American Standard Code for Information Interchange,美国信息交换标准码)ASCII码用7位(标准ASCII码)或8位(扩展ASCII码)二进制数表示一个字符,集中定义了大小写英文字母、标点符号和数字等字符和符号,共128个。计算机内部用一个字节来存放一个ASCII码字符,最高位用0表示,如“A”的ASCII编码为01000001,即65。常用的ASCII码ASCII码(十进制) 字符0—31 控制字符或通信专用字符(不可见)32 空格48—57 数字0~965—90 大写英文字母A~Z97—122 小写英文字母a~z其他 英文标点符号、运算符号、括号等(2)Unicode码Unicode是为了解决传统的字符编码方案的局限而产生的。例如,它可以用两个字节来表示一个符号,也可以用更多字节来对字符进行编码。Unicode字符集,是全球可以共享的编码字符集,涵盖了世界上主要文字的字符,其中包括简、繁体汉字,共计74 686个汉字。图像数据(如颜色)的数字化,也需要先进行采样,但不同的是,图像数据是在空间上的变化,而不是在时间上的变化。视频是图像(称为帧)在时间上的表示,一段视频就是一系列的帧连续播放而形成的,同时视频往往也有伴音。由于视频常常数据量很大,往往需要压缩存储,以便传播。1.下面选项中属于数字信号的是( )。A.胶卷上记录的照片 B.电话线中传输的信号C.录音磁带上记录的信号 D.计算机中的图片文件2.下列信号中属于数字信号的是( )。A BC D3.声音信息数字化的两个主要过程是( )。A.编码、存储 B.压缩、采样C.采样、量化 D.量化、压缩4.小明录制了一段时长为4分钟、采样频率为44.1KHz、量化位数为8位、单声道的无压缩音频,需要占用的存储空间大约是( )MB。A.20 B.10 C.40 D.55.下列关于ASCII码的描述中,错误的是( )。A.(美国信息交换标准码)用7位(标准ASCII码)或8位(扩展ASCII码)二进制数表示一个字符B.标准ASCII码字符集中定义了大小写英文字母、标点符号和数字等字符和符号,共128个C.计算机内部用一个字节来存放一个ASCII码字符,最高位用0表示D.“A”的ASCII码为01000001,即65,“a”的ASCII码与“A”的相同6.在GB2312编码方案中,存储一个汉字需要占用( )空间。A.1B B.2B C.1KB D.2b7.下列字符中,ASCII码值最大的是( )。A.a B.A C.Y D.x8.“A”的ASCII码为01000001,“B”的ASCII码为( )。A.01000000 B.01000010C.01000011 D.010001009.十进制数17转换成二进制数是( )。A.(11000)2 B.(10001)2C.(10010)2 D.(10111)210.将二进制数101011转换成十进制数是( )。A.45 B.46 C.43 D.473.2数据与结构利用计算机解决问题的过程,就是将问题中的已知数据输入计算机进行计算,然后输出结果数据的过程。为了方便对数据进行处理,我们可以选择合适的软件工具,根据问题的需要为数据抽象出合适的数据类型,然后对数据进行组织和计算。1.数据类型数据类型是用来定义一系列值及应用于这些值的一系列操作。如Python语言中的整数、浮点数、字符串、布尔等数据类型。大多数程序设计语言都定义了两种数据类型,即简单数据类型和复合数据类型。简单数据类型:不能分解为更小的数据类型,如整数、浮点数、字符串、布尔类型。复合数据类型:由简单数据类型或复合数据类型组成,如列表、字典等。常见数据类型:(1)整数(int)作用:表示人的年龄等。定义方式:age=18 或者 age=int(18)使用方法:加减乘除、逻辑判断(大于、小于)(2)浮点数(float)作用:表示身高、体重等。定义方式:salary=2.1 或者 salary=float(2.1)使用方法:加减乘除、逻辑判断(大于、小于)(3)字符串(str)作用:表示名字、爱好等。定义方式:name= tom 或者name=str( tom )使用方法:字符串只能+、*和逻辑比较,如果字符串内有引号,则包裹字符串的引号和字符串内部的引号不能相同。字符串的乘法只能乘以数字。字符串比较大小,按照ASCII码值进行比较。(4)布尔类型(bool)作用:用于判断条件结果。定义方式:True、False通常不会直接引用,需使用逻辑运算得到结果。使用方法:一般用在判断语句的返回值中。 比如 if 1<3 : print(1),1<3 为真(True)所以会执行if 里的语句块,输出1。(5)列表(list)作用:存放多个值,如多个爱好。定义方式:hobby_list=[ sing , jump , rap , basketball ]使用方法:根据索引来引用列表里的元素。如:hobby_list[0]= sing 。(6)字典(dict)作用:用来存取多个值,按照key:value的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。定义方式:在{}内用逗号分隔开多个元素,每一个元素都是key:value的格式,其中value是任意格式的数据类型,key由于具有描述性的作用,所以key通常是字符串类型。如user_info={ name : tom , age :19}。使用方法:字典取值方式不再依赖于索引,而是依赖于key,通过[key]即可获取key对应的value值。如 user_info[ name ] = tom 。2.数据结构数据结构是指存在特定关系的数据元素的集合。在解决有些问题时,一些相关联的数据将集中在一起,形成一个数据的集合,这种集合能够单独或作为一个整体被访问和处理。常见的数据结构有线性数据结构和非线性数据结构。3.线性数据结构线性数据结构又称为线性表。在线性表中,除首元素没有前趋元素、尾元素没有后继元素外,其他元素都只有一个前趋元素和一个后继元素。线性表中数据元素之间是一对一的关系。如下图所示:·队列队列是一种有限制(先进先出)的线性结构。它的数据元素只能在一端依次添加(进队),在另一端依次删除(出队)。在Python语言中,对列表的操作通常有如下方法:pop(0)方法可以删除列表的首元素,append方法可以在列表尾部添加一个数据元素,insert方法可以用于实现在中间插入元素,count方法可以统计元素出现的次数,len可以获取列表的长度。4.非线性数据结构·树结构树结构是一种具有层次关系的非线性结构,树是由n(n大于等于0)个节点组成的有限集合。(1)空树:若n=0,则称为空树。(2)非空树:任何一个非空树均满足以下两个条件:①仅有一个称为根的节点;②当n>0时,其余节点可分为m(m大于等于0)个互不相交的有限集合。(3)子树:非空树中的每个集合又是一棵树,称为根的子树。(4)根节点、子树的根节点、父节点:如图中A为根节点,B、D为A的子树的根节点,B是E、F、G的父节点。(5)树结构中数据元素之间是一对多的关系。·图结构图结构是指由一组节点(称为顶点)和一组节点间的连线(称为边或弧)构成的一种数据结构。(1)图结构中的每个顶点都可以与其他顶点有边相连。(2)边是顶点和顶点之间的连线,可以是有向的,也可以是无向的。(3)相邻顶点:由一条边连接在一起的顶点称为相邻顶点。(4)图结构中数据元素之间是多对多的关系。在树形结构中,结点间具有分支层次关系,每一层上的结点只能和上一层中的至多一个结点相关,但可能和下一层的多个结点相关。在图形结构中,任意两个结点之间都可能相关,即结点之间的邻接关系可以是任意的。1.下列选项中,具有线性结构的数据结构是( )。A.图 B.树 C.堆 D.队列2.队列的插入操作是在( )进行的。A.队尾 B.队首 C.队列任意位置 D.队首元素后3.依次在初始为空的队列中插入元素a、b、c、d以后,紧接着做了两次删除操作,此时的队首元素是( )。A.a B.b C.c D.d4.树最适合用来表示( )。A.有序数据元素 B.无序数据元素C.元素之间具有分支层次关系的数据 D.元素之间无联系的数据5.下列数据结构中,哪种数据元素之间是多对多的关系?( )A.队列 B.图结构 C.树结构 D.栈3.3数据与系统在人们的日常生活、学习和工作中,大多数问题是包含多种数据间关系的复杂问题。要解决这些复杂问题,就需要把数据存储在系统中,以使其发挥更大的作用。1.图形用户界面(Graphical User Interface,GUI)图形用户界面又称为图形用户接口,是指采用图形方式显示的计算机操作用户界面。在Python语言中,tkinter是实现图形用户界面的模块,可以快速创建GUI应用程序。方法如下:(1)导入tkinter模块(from tkinter import *);(2)运用相应代码创建交互对象(如矩形容器Frame、文本框Entry、命令按钮Button、文本标签Label等)。2.文件文件是存储在外存储设备中的相关数据的集合。3.数据库数据库是以一定的组织方式存储在计算机中的相互关联的数据集合。数据库文件中数据之间的关联有多种模型,如层次模型、网状模型和关系模型。其中,基于二维表的关系模型是最常用的。4.数据表在数据库中,数据是以二维表的形式组织存储的,称为“表”。一个表中的一列称为一个字段;表中的一行称为一条记录;表中可以唯一确定一条记录的字段称为主键。在Python语言中,对数据表的操作有:插入、删除和更新等。5.数据库管理系统(Database Management System,DBMS)数据库管理系统是定义、创建、维护数据库的一种工具,它允许用户管理和控制数据库中的数据。常见的数据库管理系统有Sybase、ORACLE、MySQL、Access等。6.数据库系统数据库系统是由数据库、数据库管理系统(及其应用开发工具)、数据库应用系统、数据库管理员和用户组成的存储、管理、处理和维护数据的系统。数据库主要用于存储数据,需要足够大的内存储器和外存储器等硬件平台的支持。软件部分除了操作系统(OS)和数据库管理系统(DBMS)外,还包括支持特定应用环境开发的软件工具以及开发完成的数据库应用系统。数据库应用系统的设计一般包括系统总体结构设计、代码设计、数据库(文件)设计、输入/输出(I/O)设计、模块功能与处理过程设计等步骤。1.在Access数据库中建立“在校学生信息统计表”时,其中“出生日期”字段的属性为( )。A.数字 B.短文本C.日期/时间 D.自动编号2.在Access 2016中,修改数据库表中的字段类型可在( )视图下进行。A.数据库表 B.SQL C.页面 D.设计3.在数据库文件中数据的关联模型有多种,下列基于哪种模型是最常用的( )。A.层次 B.网状C.二维表关系 D.记录4.数据库管理系统是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库,下列选项中不属于数据库系统的是( )。A.Foxpro B.Access C.Linux D.Sybase5.疫情期间,小明同学利用在线学习平台成功注册一个账号的过程,实质上是对平台数据库进行( )。A.创建一个表 B.添加一条记录C.创建一个数据库 D.删除一条记录3.4加密与解密数据应用既为我们带来便利,同时也存在许多安全隐患,如未经许可数据被复制、篡改、暴露或破坏。因此,在数据传输、交换、存储和处理的过程中,我们必须采取相应的策略进行数据保护,确保信息的完整、可用、保密和可靠。1.密码密码是指用来核对用户ID,以验证用户就是本人的一组字符。2.创建安全密码的一般技巧(1)使用长度不少于8个字符的密码。密码长度越长,越不容易被破解。(2)在可能的情况下,尽量使用字母、数字和特殊字符(如:&、#)相结合的密码。(3)不要使用电话号码、身份证号码或生日等信息作为密码。(4)不要使用整个用户ID或用户ID的一部分作为密码。(5)不要使用字典中能找到的词语作为密码,即使是字母次序颠倒过来的常用词语也不可以。为保障数据安全,还可采取限制登录尝试次数、使用验证码、使用用户的具有排他性的自然特征(如指纹、人脸等)作为身份验证依据等措施。3.加密加密就是将原始信息(数据)隐匿起来,使之在缺少特殊信息(数据)时不可读。加密前的原始信息(或数据)称为明文。加密后的信息(或数据)称为密文。将密文还原成明文的过程称为解密(或解码)。4.加法密码加法密码又称移位密码。在加法密码算法中,明文中的所有字母都在字母表上向后(或向前)按照一个固定数目进行偏移后被替换成密文。恺撒密码就是加法密码的典型代表,是一种最为古老的对称加密体制。加密算法操作中的一组数字被称为密钥。比如,恺撒密码的密钥为3,加密和解密使用同一个密钥,被称为对称加密体制。·2017年6月1日起施行的《中华人民共和国网络安全法》明确要求网络运营者应当按照网络安全等级保护制度的要求,履行安全保护义务,保障网络免受干扰、破坏或者未经授权的访问,防止网络数据泄露或者被窃取、篡改。·《中华人民共和国刑法》第285条至第287条,对非法侵入计算机信息系统,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,利用计算机实施金融诈骗、盗窃、贪污、挪用公款、窃取国家秘密等行为进行了量刑定罪。1.常采用数据加密技术来防止信息系统中的数据被破坏,下列说法中错误的是( )。A.数据加密是通过加密算法和加密密钥将明文转变为密文B.数据解密则是通过解密算法和解密密钥将密文转换为明文C.为了确保加密与解密可逆,加密与解密的密钥必须相同D.量子密钥是目前人类最安全的加密方式2.数据加密是一种信息安全技术。下列关于数据加密的说法中错误的是( )。A.数据加密是利用密码技术对信息进行加密,实现信息隐蔽B.凯撒密码是一种加密技术C.数据加密技术主要分为对称加密和非对称加密D.现在的数据加密技术很成熟,加密后的数据不会泄露3.选项中下列不适合作为密码使用的是( )。A.ui7#*1r B.@*yh637jkC.20210204 D.cGyh09%h4.在银行自动柜员机上取款时,计算机要求输入密码,这属于网络安全技术中的( )。A.防火墙技术 B.加密传输技术C.病毒防治技术 D.身份认证技术5.二维码的应用范围日益扩大,如火车票、微信等。下列关于二维码技术的叙述中错误的是( )。A.按一定规律分布在平面上的黑白相间的几何图形上记录数据符号信息B.通过图像输入设备或光电扫描设备自动识读以获取相关信息C.二维码的应用极大地提高了数据采集和信息处理的速度D.二维码比普通条形码信息容量小,保密性差第3单元3.1 1.D 2.D 3.C 4.B 5.D 6.B 7.D 8.B 9.B 10.C3.2 1.D 2.A 3.C 4.D 5.B3.3 1.C 2.D 3.C 4.C 5.B3.4 1.C 2.D 3.C 4.D 5.D 展开更多...... 收起↑ 资源预览