资源简介 课时11 数据管理与大数据【学业要求】知识点 学业水平等级1.了解数据管理的基本方法,理解对数据进行保护的意义。 22.掌握大数据的概念、特征和思维方式。 4(2024年6月浙江选考)下列关于数据与信息的说法,正确的是( )A.数据以二进制方式编码后才能存储在计算机中B.大数据技术不能处理非结构化数据C.同一数据经解释后产生的信息都是相同的D.信息加工处理后不会产生更有价值的信息答案 A解析 本题考查数据、信息和二进制编码及大数据特征相关知识点。A选项计算机数据都是以二进制的方式进行存储;B选项大数据的特征之一是数据类型多,包含结构化数据、半结构化数据和非结构化数据,大数据技术能处理非结构化数据;C选项人们对相同的数据可以有不同的解释,可以获得不一样的信息;D选项信息经过加工处理后,可能产生更有价值的信息。1.数据形式有结构化数据、半结构化数据和非结构化数据。结构化数据由 来进行逻辑表达和实现的数据,往往存储在数据库中。非结构化数通常指各种 、图片、各类报表、图像、音频和视频。 2.计算机中,数据一般以 的形式存储,一般采用 形目录结构来管理文件。 3.根据 规则的不同,文件的格式也不相同,用以区分不同类型的存储数据,如文本、图像、音频等。 4.大数据的定义围绕信息量 、产生速度 、数据类型 和价值密度 4个特性,可以从特性来看是否是大数据。 5.大数据的思维体现在分析的是 数据,而不是 数据;对于数据不再追求 性,而是能够接受数据的 性;不一定强调对事物因果关系的探求,而是更加注重它们的相关性。 6.大数据技术不仅能处理 数据,还能处理大量的 数据。 7.大数据往往采用 的思想进行处理,数据类型分别静态、 和图数据三种。 自我校对:1.二维表结构 文本 2.文件 树 3.编码4.大 快 多 低 5.全体 抽样 精确 混杂6.结构化 非结构化 7.分治 动态【典例1】 下列关于数据管理的说法,正确的是( )A.计算机管理文件一般采用树形目录结构B.利用计算机对数据进行管理一定比人工管理高效C.建立容灾系统,可以解决操作失误或系统故障导致的数据丢失问题D.随着数据数量的增加和结构的多元化,数据管理越发向传统数据库技术发展思维点拨明考向 本题考查数据管理相关知识精点拨 A 磁盘分为C,D等盘,为树的根,在根中建有文件夹,文件夹下有文件,因此属于树形结构B 计算机管理文件速度快,更高效,数据量少的情况人工管理可能效率更高C 容灾系统是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用D 传统数据库已经很难管理,通过云计算,大数据等处理技术对数据进行管理答案 A【变式1】 下列关于数据管理与安全的说法,正确的是( )A.利用计算机对数据进行管理一定比手工管理高效B.数据库管理相比文件管理,优势在于数据共享、冗余减少C.传输数据时可以通过数据校验提高数据的保密性D.将电脑中的资料备份到移动硬盘中,是为了提高数据本身的安全答案 B解析 本题考查数据管理相关知识。A选项在数据量少的情况手工管理可能效率更高;C选项数据校验提高的是数据的完整性,数据加密提高的是数据的保密性;D选项将电脑中的资料备份到移动硬盘中,是为了提高存储数据介质的安全。【典例2】 下列关于数据和信息的说法,正确的是( )A.计算机中的数据都是以二进制和十六进制形式存储的B.数据已成为当今社会重要的生产资料C.信息经过加工处理后一定会产生更有价值的信息D.大数据处理中的图计算就是对大量图片的处理思维点拨明考向 本题考查数据和信息的相关知识精点拨 A 计算机中的数据都是以二进制形式存储B 信息经过加工处理后不一定会产生更有价值的信息C 信息经过加工处理后不一定会产生更有价值的信息D 图计算是一种用于处理图形结构数据的计算方式,不是指图片的处理答案 B【变式2】 下列关于数据和信息的说法,正确的是( )A.只有非结构化数据才是大数据B.同一数据经过解释后可以产生不同的信息C.文字是数据的表现形式而不是数据的载体D.大数据的价值密度低,因此总价值小答案 B解析 A选项大数据包括结构化数据、半结构化数据和非结构化数据。B选项同一数据经过解释后可以产生不同的信息。C选项文字是数据的表现形式也是数据的载体。D选项大数据的价值密度相对较低。 数据经过采样、量化和编码后,形成二进制代码,按照不同的编码方式,形成不同格式的文件,并以树形结构保存硬件等存储器中。根据大数据的4V特征来判断哪些属于大数据,大数据包含按行列存储的结构化数据,同时还包含文本、图像和音视频等大量的非结构化数据。处理大数据时一般采用分治思想,不仅能处理结构化数据,还能处理非结构化数据。1.下列关于大数据的说法,正确的是( )A.大数据的数据体量巨大,价值密度高B.处理大数据时,一般采用分治思想C.大数据接收数据混杂,主要探求数据间的因果关系D.大数据的应用,避免了用户隐私信息泄露的风险答案 B解析 A选项大数据价值密度低。C选项大数据讲究数据的相关性。D选项大数据的应用可能带来用户隐私信息泄露。2.北斗导航一般指北斗卫星导航系统,是中国自行研制的全球卫星导航系统。随着"北斗"全球系统的发展,接入用户的业务类型将不断增加。用户段数据可涵盖文字、语音、视频等多种形式,这体现了大数据的特征是( )A.数据体量巨大B.数据产生和处理的速度快C.价值密度低D.数据类型多答案 D解析 本题考查大数据的特征。用户段数据可涵盖文字、语音、视频等多种形式,体现数据类型多的特征。3.下列关于大数据与大数据处理的说法,不正确的是( )A.大数据价值密度低,“提纯"大数据可以让其发挥更大的价值B.高速公路中实时产生的车流量数据属于静态数据C.词频统计是文本数据处理中特征提取的一种方法D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据答案 B解析 高速公路中实时产生的车流量数据是不间断地、持续到达的,属于流数据。4.下列关于大数据及数据处理的说法,不正确的是( )A.不同时刻产生的重复数据可直接删除以节省存储空间B.处理大数据时一般采用分治思想C.大数据要分析的是全体数据,能接受数据的混杂性D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等答案 A解析 A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。5.下列有关大数据处理的说法,不正确的是( )A.处理大数据时,一般采用分治思想B.对历史数据一般采用批处理方式C.大数据处理时要求所有的数据都准确D.大数据分析的是全体数据,而不是抽样数据答案 C解析 C选项大数据不再追求数据的精确性,当数据量大到一定程度时,个别数据的不准确不会影响结果。6.下列关于数据、信息的说法,正确的是( )A.信息只有在数字化后才能呈现B.处理大数据时一般采用分治思想C.大数据技术不能处理非结构化数据D.数据加工处理后提取的信息都是相同的答案 B解析 本题考查数据、大数据和信息的概念。A选项处理信息不是一定要采用计算机,人工可以处理模拟信号的数据。B选项大数据的处理方法往往将一个复杂的问题分成两个或更多的相同或相似的子问题,再将子问题分成更小的子问题,直到最后子问题可以简单地直接求解。C选项大数据技术不仅限于处理结构化数据,而是能够全面应对各种类型的数据,包括非结构化数据。D选项不同的人对同一数据的解读可能是不一样的,因此提取的信息可能不同。1.下列关于数据的说法,正确的是( )A.不同时刻产生的重复数据可直接删除以节省存储空间D.大数据的应用,避免了用户隐私信息泄露的风险C.社交关系数据一般采用流计算模式进行处理D.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息答案 D解析 本题考查数据和大数据的处理。A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。B选项大数据的应用可能带来用户隐私信息泄露。C选项社交关系数据往往为图数据,应用图计算。D选项数据可视化是将数据以图表的形式表现出来。2.下列关于数据与信息的说法,正确的是( )A.数据在处理过程中不会产生新的信息B.信息在网络上传播不需要依附于载体C.在大数据处理过程中需要保证每个数据都准确无误D.文字、图像、声音等数据在计算机中都以二进制存储答案 D解析 A选项数据在处理过程中会产生新的信息;B选项信息不能独立存在必须依附于一定的载体;C选项大数据不追求精确性,能够接受数据的混杂性。3.下列关于数据与信息的说法,正确的是( )A.当前数据的获取方法以机器获取为主B.大数据给生活带来的只有便利没有安全隐患C.信息在被重复使用的过程中会产生损耗D.即使承载信息的载体遭到破坏,其承载的信息也不会消失答案 A解析 C选项信息具有共享性,不会产生损耗。D选项信息具有载体依附性。4.下列关于数据与信息的说法,不正确的是( )A.大数据经过处理可以有更高的价值B.信息是数据经过分析及解释后产生的意义C.信息在传递过程中可以变换载体,但不能脱离载体D.计算机中不同类型的数据均以二进制方式存储,编码形式也相同答案 D解析 D选项计算机中数据以文件形式存在,不同的文件采用不同的编码方式。5.下列关于数据与信息的说法,不正确的是( )A.在计算机中,数据一般以文件的形式存储B.存储信息的载体遭到破坏,其承载的信息会消失C.大数据需要特定的技术和分析方法将其转化为价值D.预订车票时,余票的数量是数据,座位等级不是数据答案 D解析 A选项计算机中以文件形式存储数据。B选项信息具有载体依附性。C选项对大数据的分析就是为了获取大数据的价值。D选项座位等级也是数据。6.下列有关数据、大数据和信息的说法正确的是( )A.同一数据在不同语境中承载的信息可能不同B.数据在计算机中可以采用十六进制方式进行存储C.信息的保存和传播必须依附于载体,信息的价值永恒不变D.若数据库中的数据量特别庞大,这样的数据就可以称为大数据答案 A解析 D选项大数据必须具有4大特征。7.下列关于大数据及数据处理的说法,不正确的是( )A.大数据的应用,避免了用户隐私信息泄露的风险B.处理大数据时一般采用分治思想C.大数据要分析的是全体数据,能接受数据的混杂性D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等答案 A解析 A选项大数据的应用可能带来用户隐私信息泄露。8.下列关于数据安全与大数据的说法正确的是( )A.保护数据的安全需要做好存储介质的保护B.数据校验是为保证数据的保密性进行的一种验证操作C.学生学籍系统中存放着的学生数据属于大数据D.大数据价值密度低,不存在数据安全的问题答案 A解析 A选项存储介质损坏会导致数据的损坏,因此数据的安全问题也要考虑存储介质的安全。B选项数据校验是为保证数据的完整性。C选项学籍系统数据不符合大数据特征。D选项大数据也存在个人隐私和数据安全问题。(共33张PPT)必修一 数据与计算课时11 数据管理与大数据知识点 学业水平等级1.了解数据管理的基本方法,理解对数据进行保护的意义。 22.掌握大数据的概念、特征和思维方式。 4目 录CONTENTS真题剖析01知识梳理02课堂突破03当堂检测04课后作业05真题剖析1(2024年6月浙江选考)下列关于数据与信息的说法,正确的是( )A.数据以二进制方式编码后才能存储在计算机中B.大数据技术不能处理非结构化数据C.同一数据经解释后产生的信息都是相同的D.信息加工处理后不会产生更有价值的信息解析 本题考查数据、信息和二进制编码及大数据特征相关知识点。A选项计算机数据都是以二进制的方式进行存储;B选项大数据的特征之一是数据类型多,包含结构化数据、半结构化数据和非结构化数据,大数据技术能处理非结构化数据;C选项人们对相同的数据可以有不同的解释,可以获得不一样的信息;D选项信息经过加工处理后,可能产生更有价值的信息。A知识梳理21.数据形式有结构化数据、半结构化数据和非结构化数据。结构化数据由________________来进行逻辑表达和实现的数据,往往存储在数据库中。非结构化数通常指各种________、图片、各类报表、图像、音频和视频。 2.计算机中,数据一般以________的形式存储,一般采用________形目录结构来管理文件。 3.根据________规则的不同,文件的格式也不相同,用以区分不同类型的存储数据,如文本、图像、音频等。 4.大数据的定义围绕信息量________、产生速度______、数据类型______和价值密度________4个特性,可以从特性来看是否是大数据。 二维表结构文本文件树编码大快多低5.大数据的思维体现在分析的是________数据,而不是________数据;对于数据不再追求________性,而是能够接受数据的________性;不一定强调对事物因果关系的探求,而是更加注重它们的相关性。 6.大数据技术不仅能处理________数据,还能处理大量的____________数据。 7.大数据往往采用________的思想进行处理,数据类型分别静态、________和图数据三种。 全体抽样精确混杂结构化非结构化分治动态课堂突破3【典例1】 下列关于数据管理的说法,正确的是( )A.计算机管理文件一般采用树形目录结构B.利用计算机对数据进行管理一定比人工管理高效C.建立容灾系统,可以解决操作失误或系统故障导致的数据丢失问题D.随着数据数量的增加和结构的多元化,数据管理越发向传统数据库技术发展答案 A思维点拨 明考向 本题考查数据管理相关知识精点拨 A 磁盘分为C,D等盘,为树的根,在根中建有文件夹,文件夹下有文件,因此属于树形结构B 计算机管理文件速度快,更高效,数据量少的情况人工管理可能效率更高C 容灾系统是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用D 传统数据库已经很难管理,通过云计算,大数据等处理技术对数据进行管理【变式1】 下列关于数据管理与安全的说法,正确的是( )A.利用计算机对数据进行管理一定比手工管理高效B.数据库管理相比文件管理,优势在于数据共享、冗余减少C.传输数据时可以通过数据校验提高数据的保密性D.将电脑中的资料备份到移动硬盘中,是为了提高数据本身的安全解析 本题考查数据管理相关知识。A选项在数据量少的情况手工管理可能效率更高;C选项数据校验提高的是数据的完整性,数据加密提高的是数据的保密性;D选项将电脑中的资料备份到移动硬盘中,是为了提高存储数据介质的安全。B【典例2】 下列关于数据和信息的说法,正确的是( )A.计算机中的数据都是以二进制和十六进制形式存储的B.数据已成为当今社会重要的生产资料C.信息经过加工处理后一定会产生更有价值的信息D.大数据处理中的图计算就是对大量图片的处理答案 B思维点拨 明考向 本题考查数据和信息的相关知识精点拨 A 计算机中的数据都是以二进制形式存储B 信息经过加工处理后不一定会产生更有价值的信息C 信息经过加工处理后不一定会产生更有价值的信息D 图计算是一种用于处理图形结构数据的计算方式,不是指图片的处理【变式2】 下列关于数据和信息的说法,正确的是( )A.只有非结构化数据才是大数据B.同一数据经过解释后可以产生不同的信息C.文字是数据的表现形式而不是数据的载体D.大数据的价值密度低,因此总价值小解析 A选项大数据包括结构化数据、半结构化数据和非结构化数据。B选项同一数据经过解释后可以产生不同的信息。C选项文字是数据的表现形式也是数据的载体。D选项大数据的价值密度相对较低。B 数据经过采样、量化和编码后,形成二进制代码,按照不同的编码方式,形成不同格式的文件,并以树形结构保存硬件等存储器中。根据大数据的4V特征来判断哪些属于大数据,大数据包含按行列存储的结构化数据,同时还包含文本、图像和音视频等大量的非结构化数据。处理大数据时一般采用分治思想,不仅能处理结构化数据,还能处理非结构化数据。当堂检测41.下列关于大数据的说法,正确的是( )A.大数据的数据体量巨大,价值密度高B.处理大数据时,一般采用分治思想C.大数据接收数据混杂,主要探求数据间的因果关系D.大数据的应用,避免了用户隐私信息泄露的风险B解析 A选项大数据价值密度低。C选项大数据讲究数据的相关性。D选项大数据的应用可能带来用户隐私信息泄露。2.北斗导航一般指北斗卫星导航系统,是中国自行研制的全球卫星导航系统。随着"北斗"全球系统的发展,接入用户的业务类型将不断增加。用户段数据可涵盖文字、语音、视频等多种形式,这体现了大数据的特征是( )A.数据体量巨大 B.数据产生和处理的速度快C.价值密度低 D.数据类型多D解析 本题考查大数据的特征。用户段数据可涵盖文字、语音、视频等多种形式,体现数据类型多的特征。A.大数据价值密度低,“提纯"大数据可以让其发挥更大的价值B.高速公路中实时产生的车流量数据属于静态数据C.词频统计是文本数据处理中特征提取的一种方法D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据B解析 高速公路中实时产生的车流量数据是不间断地、持续到达的,属于流数据。A.不同时刻产生的重复数据可直接删除以节省存储空间B.处理大数据时一般采用分治思想C.大数据要分析的是全体数据,能接受数据的混杂性D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等A解析 A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。A.处理大数据时,一般采用分治思想B.对历史数据一般采用批处理方式C.大数据处理时要求所有的数据都准确D.大数据分析的是全体数据,而不是抽样数据C解析 C选项大数据不再追求数据的精确性,当数据量大到一定程度时,个别数据的不准确不会影响结果。6.下列关于数据、信息的说法,正确的是( )A.信息只有在数字化后才能呈现B.处理大数据时一般采用分治思想C.大数据技术不能处理非结构化数据D.数据加工处理后提取的信息都是相同的B解析 本题考查数据、大数据和信息的概念。A选项处理信息不是一定要采用计算机,人工可以处理模拟信号的数据。B选项大数据的处理方法往往将一个复杂的问题分成两个或更多的相同或相似的子问题,再将子问题分成更小的子问题,直到最后子问题可以简单地直接求解。C选项大数据技术不仅限于处理结构化数据,而是能够全面应对各种类型的数据,包括非结构化数据。D选项不同的人对同一数据的解读可能是不一样的,因此提取的信息可能不同。课时作业51.下列关于数据的说法,正确的是( )A.不同时刻产生的重复数据可直接删除以节省存储空间D.大数据的应用,避免了用户隐私信息泄露的风险C.社交关系数据一般采用流计算模式进行处理D.数据可视化是将数据以图形图像等形式表示,直观呈现数据中所蕴含的信息D解析 本题考查数据和大数据的处理。A选项有时候可能一条记录将出现多次,需要统计出现的次数,因此不一定可以直接删除。B选项大数据的应用可能带来用户隐私信息泄露。C选项社交关系数据往往为图数据,应用图计算。D选项数据可视化是将数据以图表的形式表现出来。2.下列关于数据与信息的说法,正确的是( )A.数据在处理过程中不会产生新的信息B.信息在网络上传播不需要依附于载体C.在大数据处理过程中需要保证每个数据都准确无误D.文字、图像、声音等数据在计算机中都以二进制存储D解析 A选项数据在处理过程中会产生新的信息;B选项信息不能独立存在必须依附于一定的载体;C选项大数据不追求精确性,能够接受数据的混杂性。3.下列关于数据与信息的说法,正确的是( )A.当前数据的获取方法以机器获取为主B.大数据给生活带来的只有便利没有安全隐患C.信息在被重复使用的过程中会产生损耗D.即使承载信息的载体遭到破坏,其承载的信息也不会消失A解析 C选项信息具有共享性,不会产生损耗。D选项信息具有载体依附性。A.大数据经过处理可以有更高的价值B.信息是数据经过分析及解释后产生的意义C.信息在传递过程中可以变换载体,但不能脱离载体D.计算机中不同类型的数据均以二进制方式存储,编码形式也相同D解析 D选项计算机中数据以文件形式存在,不同的文件采用不同的编码方式。A.在计算机中,数据一般以文件的形式存储B.存储信息的载体遭到破坏,其承载的信息会消失C.大数据需要特定的技术和分析方法将其转化为价值D.预订车票时,余票的数量是数据,座位等级不是数据D解析 A选项计算机中以文件形式存储数据。B选项信息具有载体依附性。C选项对大数据的分析就是为了获取大数据的价值。D选项座位等级也是数据。6.下列有关数据、大数据和信息的说法正确的是( )A.同一数据在不同语境中承载的信息可能不同B.数据在计算机中可以采用十六进制方式进行存储C.信息的保存和传播必须依附于载体,信息的价值永恒不变D.若数据库中的数据量特别庞大,这样的数据就可以称为大数据A解析 D选项大数据必须具有4大特征。A.大数据的应用,避免了用户隐私信息泄露的风险B.处理大数据时一般采用分治思想C.大数据要分析的是全体数据,能接受数据的混杂性D.文本数据处理的过程主要包括分词、特征提取、数据分析和结果呈现等A解析 A选项大数据的应用可能带来用户隐私信息泄露。8.下列关于数据安全与大数据的说法正确的是( )A.保护数据的安全需要做好存储介质的保护B.数据校验是为保证数据的保密性进行的一种验证操作C.学生学籍系统中存放着的学生数据属于大数据D.大数据价值密度低,不存在数据安全的问题A解析 A选项存储介质损坏会导致数据的损坏,因此数据的安全问题也要考虑存储介质的安全。B选项数据校验是为保证数据的完整性。C选项学籍系统数据不符合大数据特征。D选项大数据也存在个人隐私和数据安全问题。 展开更多...... 收起↑ 资源列表 课时11 数据管理与大数据.docx 课时11 数据管理与大数据.pptx