浙教版(2019) 选修1 第六章 大数据时代数据的组织 练习(共2份,含答案)

资源下载
  1. 二一教育资源

浙教版(2019) 选修1 第六章 大数据时代数据的组织 练习(共2份,含答案)

资源简介

第六章 大数据时代数据的组织
课时1 实时查询系统中数据的组织
一、基础巩固
1.下列关于分布式存储系统说法错误的是(  )
A.分布式存储系统需要使用多台服务器共同存储数据
B.分布式存储系统需要多台服务器同时工作
C.分布式存储系统中的多台服务器通过网络进行连接
D.在有服务器出现故障的情况下分布式存储系统将不可用
2.使用数组来组织并存储数据时,使用二分查找算法在一个有序序列中查找新增元素的插入位置,其时间复杂度为(  )
A.O(1) B.O(n) C.O(log2n) D.O(n2)
3.使用链表来组织并存储数据时,要在链表中查找新元素的插入位置,其时间复杂度为(  )
A.O(1) B.O(n) C.O(log2n) D.O(n2)
4.下列有关跳跃表的描述中,不正确的是(  )
A.跳跃表是一种特殊的有序链表
B.跳跃表是由多层有序链表组合而成的,最底一层的链表保存了所有的数据
C.相邻的两层链表中元素相同的节点之间存在引用关系
D.使用跳跃表不仅提高了查询效率,同时也节省了存储空间
5.有如图所示跳跃表:
若要在原链表中插入元素12,需比较的次数为(  )
A.1次 B.3次 C.4次 D.5次
二、能力提升
6.有如下图所示跳跃表:
若要在原链表中查找元素27,则查找次数为(  )
A.1次 B.2次 C.3次 D.4次
7.有如下图所示的跳跃表:
请画出删除元素6后的链表状态。
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
8.跳跃表是一种立足链表,借鉴二分查找的思想而形成的数据结构。能否立足有序数组,借鉴链表的思想构造一种新的数据结构来解决上述问题?
_____________________________________________________________________
9.在组织、处理大数据时,可采用内存数据库与磁盘数据库,请从处理速度和安全性两方面说明内存数据与传统的磁盘数据库相比存在哪些优势和不足。
(1)内存数据库的优势:_________________________________________________
___________________________________________________________________________________________________________________________________________
(2)内存数据库的不足:_________________________________________________
____________________________________________________________________________________________________________________________________________
课时1 实时查询系统中数据的组织
1.D [本题主要考查的是分布式存储系统。分布式存储系统需要使用多台服务器共同存储数据,但随着服务器数量的增加,服务器出现故障的概率也会不断增加。为了保证在有服务器出现故障的情况下系统仍然可用,分布式存储系统一般采用把一个数据分成多份存储在不同的服务器中的方法来解决,因此,在有服务器出现故障的情况下分布式存储系统仍将可用,答案为D。]
2.C [本题主要考查二分查找算法的时间复杂度。使用二分查找算法查找某个位置的时间复杂度为O(log2n),因此,答案为C。]
3.B [本题主要考查的是在链表中的进行数据查找的时间复杂度。在链表中查找数据或数据位置时,需要从链表的一端依次遍历查找,因此其时间复杂度为O(n),因此,答案为B。]
4.D [本题主要考查的是跳跃表的特点。使用跳跃表的目的在于提高了查询效率,但同时也增加一定的存储空间,因此答案为D。]
5.C [本题主要考查的是跳跃表的插入操作。要在原链表中插入元素12,关键是要找到插入的位置,通过与关键节点1、5、10、15的比较,可确定插入的位置,因此比较次数为4次,答案为C。]
6.C [本题主要考查的是在跳跃中查找数据元素。首先从二级索引中经过2次比较确定一个大致区间,然后通过对应关系到达一级索引,最终到达原链表中找到元素27,因此共查找次数为3次,答案为C。]
7.删除元素6后的链表状态为:
解析 本题主要考查的是删除跳跃表中的关键节点。当原链表中的数据元素被删除时,各级索引中的关键节点也需要随之删除,删除时按照查找时的层次从上往下依次进行,每当找到对应的元素,就删除当前层的关键节点,直到最底层的原链表。
8.能。有序数组在查找数据方面的效率较高,但在插入新数据的效率较低,因为新数据后面的数据元素需要连续后移,因此需要进行优化。将原来一个数组中的数据均匀分解存储到k个数组中,这样就将原来O(n)的移动复杂度降为O()。
9.(1)内存数据库的优势:内存数据库是将需要处理的数据保存在内存中并直接操作的数据库,内存的读写速度比磁盘高出几个数量级,因此内存数据库在数据的输入和输出上极大地提高了系统的性能。内存数据库数据处理速度比传统数据库的数据处理速度一般都在10倍以上。
(2)内存数据库的不足:内存在系统中是稀缺的资源,因此内存数据库的容量大小受物理内存的限制,通常只有热点或者高频数据进行处理,而不是全部数据。安全性是内存数据库最大的问题,电脑一旦断电或重启,内存中的信息将会丢失,因此在使用内存数据库时,通常需要提前对内存上的数据采取一些保护机制,比如备份,记录日志,热备或集群,与磁盘数据库同步等方式。课时2 POI数据的组织与应用
1.随着计算机技术、通信技术和3S技术的发展融合,互联网环境中的地理信息服务已经成为人们网络生活的重要组成部分,这里的3S是指地理信息系统GIS、全球定位系统GPS和(  )
A.通信技术 B.遥感技术
C.虚拟现实技术 D.无线网络技术
2.在导航地图中搜索“美食”后显示效果如图所示,可知该电子地图上表示POI的图标是(  )
A.圆点 B.形状 C.气泡 D.直线
3.衡量POI数据价值的指标有(  )
①空间位置的准确性 ②信息点的类别
③空间位置的数量 ④信息点的经纬度
⑤空间位置的覆盖率
A.①③⑤ B.③④⑤
C.①③④⑤ D.①②③④⑤
4.以下不属于POI数据的组织采用空间索引目的的是(  )
A.快速访问空间对象 B.缩短空间查询时间
C.缩小空间搜索范围 D.提供海量存储空间
5.如图所示,将一幅地图的地理范围均等划分为M行N列,得到M×N个小矩形网格区域。每一个网格区域为一个索引项,该技术的名称为(  )
A.网格索引 B.树结构索引 C.云计算 D.表格划分
二、能力提升
6.以下关于POI数据的描述中不正确的是(  )
A.电子地图上的景点、公司、商场、饭馆等,都是POI
B.POI描述了空间实体或者区域的空间位置、名称地址等信息
C.POI数据一般用Access等小型数据库来进行组织和存储
D.Hadoop为海量POI数据的存储与计算提供了保障
7.下列有关空间索引问题的描述中,错误的是(  )
A.空间索引包含对象的概要信息,如对象的标识等
B.空间索引可以缩短空间查询时间,提高效率
C.POI数据可能出现在多个索引位置中,经常使用网格空间索引来对POI建立空间索引
D.空间索引是指依据空间对象的位置和形状或对象间某种空间关系,按一定顺序排列的数据结构
8.将一个经纬度信息,转换成一个可以排序,可以比较的字符串编码,如下图所示,从而做到高效地查找临近POI点的算法称为(  )
A.二分查找 B.对分查找 C.N分查找 D.GeoHash
课时2 POI数据的组织与应用
1.B [本题主要考查的是3S技术。3S技术是指遥感技术(Remote sensing,RS)、地理信息系统(Geography information systems,GIS)和全球定位系统(Global positioning systems,GPS)的统称,因此,答案为B。]
2.C [本题主要考查的是电子地图上POI的表示形式。该电子地图表示POI的图标是气泡,因此,答案为C。]
3.A [衡量POI数据价值的指标有空间位置的准确性和覆盖率、空间位置的数量,因此,答案为A。]
4.D [本题考查的是POI数据的组织与表示。空间索引可以使空间操作快速访问对象,缩短空间查询时间,缩小空间搜索范围,从而提高效率。提供海量存储空间不属于POI数据的组织采用空间索引目的,因此,答案为D。]
5.A [本题考查的是POI数据的组织与表示。空间索引技术大致分为基于树结构、基于网格划分等。本题的描述是网格索引的空间索引技术。]
6.C [本题考查的是POI数据的概念、组织与表示等。POI海量数据不可能用小型数据库来进行组织和存储。]
7.C [本题主要考查的是POI数据的组织中空间索引问题。POI数据本身是点信息,一个数据仅可能出现在一个索引位置中,因此经常使用网格空间索引来对POI建立空间索引,因此,答案为C。]
8.D [本题主要考查的是GeoHash算法。GeoHash算法把一个坐标点映射到一个字符串上,每个字符串代表的就是一个以经纬度划分的矩形区域,而每个区域又可以划分为许多个子区域,并对经纬度不断地进行二分,最终确定到想要的精度,每个区域最后都得到一个二进制的字符串,这样就可以快速进行周边POI查找之类的功能。]

展开更多......

收起↑

资源列表