5.5物理结构设计 课件(共20张PPT)-《数据库应用技术-SQL Server》同步教学(人民邮电版)

资源下载
  1. 二一教育资源

5.5物理结构设计 课件(共20张PPT)-《数据库应用技术-SQL Server》同步教学(人民邮电版)

资源简介

(共20张PPT)
数据库系统设计
第5章
目录
01
数据库系统
设计概述
02
需求分析
03
概念结构设计
04
逻辑结构设计
05
物理结构设计
06
数据库实施
07
数据库运行
和维护
本章主要内容
本章主要介绍数据库系统设计的整体过程及具体设计过程中使用的相关方法和技术。从数据库设计的概念出发,引出了数据库系统设计的内容、特点、使用的方法、基本过程和步骤;重点介绍需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施、数据库运行和维护等阶段的具体设计内容和步骤,并详细介绍需求分析、概念结构设计、逻辑结构设计的模型设计方法和模型创建步骤。
准备知识
模型是对事物、对象、过程等客观系统中人们感兴趣的内容的模拟和抽象表达,是理解系统的思维工具。
数据模型也是一种模型,是计算机世界对现实世界数据特征的抽象、表示和处理的工具。
数据库不仅要反映数据本身内容,而且要反映数据之间的联系,而这种模拟是通过数据模型实现的。
数据模型是数据库的框架,是数据库的核心和基础。
物理结构设计
第5章
05
相关概念
数据库的物理结构(即内模式):指实现在物理设备上的存储结构和存储方法。
物理结构设计:基于优化后的数据库逻辑结构,数据库设计人员利用具体数据库管理系统所提供的方法和技术,选取一个最适合应用要求的数据库存储结构和数据存取路径,设计合理的数据存储位置,分配适当的存储空间,设计出高效的、可实现的物理数据库结构的过程。
5.5.1 物理结构设计的步骤
数据库的物理结构设计分2步进行:
(1)确定数据的物理结构。即确定数据库的存取方法和存储结构。
(2)对物理结构进行评价。对物理结构评价的重点是时间效率和空间效率。
说明:物理结构设计的结果并不唯一,但数据库设计人员追求的设计目标一致。
5.5.1 物理结构设计的步骤
进行物理结构设计需要注意以下几个问题:
(1) 熟悉具体选定的数据库管理系统的特点,全面掌握选定数据库管理系统的功能、数据库管理系统提供的物理环境和工具及其限制条件。
(2)详细分析将要在数据库上运行的事务,了解计算机系统的性能和数据使用频率。
基于关系数据库理论的物理结构设计包含以下两方面的内容。
(1) 为关系模式选取合适的存取方法。
(2) 确定关系、索引、聚簇、日志和备份等的物理存储结构。
5.5.2 确定数据存取方法
设计人员在确定数据存取方法时,需要详细掌握与数据库相关的3种信息。
(1)查询事务信息。
(2)更新事务信息。
(3)每个事务在各个关系上运行的频率和性能要求。
关系数据库系统提供3种数据存取方法:
(1)索引方法
(2)聚簇方法
(3)散列方法
1. 索引及其创建原则
索引:建立在数据库表上的一个附加表,表中存储了满足用户常用的查询操作的列值和对应的记录地址。
在建立索引时,需要遵循以下3个原则。
(1)若某属性或属性组经常在查询条件中出现,则考虑在这个属性或属性组上建立索引。
(2)若某属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引。
(3)若某属性或属性组经常出现在连接操作的连接条件中,则考虑在这个属性或属性组上建立索引。
1. 聚簇及其创建原则
索引的局限性:耗费存储空间资源,付出系统维护代价。
创建的索引数量需要结合具体数据库的操作考虑。查询操作多,修改操作少,可以多创建索引;反之,则要少创建一些。
2. 聚簇及其创建原则
聚簇:指把经常进行的连接操作中相关的属性或属性组取值相同的元组集中存放在连续的物理块上,以提高基于这些属性或属性组值的查询速度,这些属性或属性组称为聚簇码。
设计聚簇分以下2步进行:
(1)根据规则确定候选聚簇。
(2)从候选聚簇中去除不必要的关系。
2. 聚簇及其创建原则
在设计候选聚簇时,需要遵循以下4个原则。
(1)经常在一起进行连接操作的关系,可以创建一个聚簇。
(2)若某关系的一组属性经常出现在相等、比较条件中,则该单个关系可建立聚簇。
(3)若某关系的一个(或一组)属性值的重复率很高,则该单个关系可建立聚簇。对应每个聚簇码值的平均元组不能太少,若元组数量太少,聚簇的效果不明显。
(4)若某关系的主要应用是通过聚簇码进行访问或连接,而其他属性访问关系的操作很少时,可以使用聚簇。尤其当SQL语句中含有与聚簇有关的ORDER_BY、GROUP_BY、UNION、DISTINCT 等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作。反之,当关系较少利用聚簇码操作时,最好不要使用聚簇。
2. 聚簇及其创建原则
说明:
(1)对于数据更新不频繁的关系,适合创建聚簇。
(2)一个数据库可以建立多个聚簇,但一个关系只能加入一个聚簇。
(3)聚簇功能不仅适用于单个关系,而且适用于经常进行连接操作的多个关系。
2. 聚簇及其创建原则
设计好候选聚簇后,设计人员采用如下方法删去其中不必要的关系:
(1)从候选聚簇中删除经常进行全表扫描的关系。
(2)从候选聚簇中删除更新操作远多于连接操作的关系。
(3)由于一个关系不能同时加入多个聚簇,当出现不同的聚簇中可能包含同一个关系的情况时,设计人员需要从多个聚簇方案(包括不建立聚簇)中选择一个较优的聚簇,选取标准是在这个聚簇上运行各种事务的总代价最小。
2. 聚簇及其创建原则
创建聚簇需要注意的2个问题:
(1)在已有的关系上建立聚簇,会移动关系中元组的物理存储位置,原有关系上创建的索引将不再有效,要想使用原索引就必须重建原有索引。
(2)聚簇码值应当相对稳定。
5.5.3 确定数据的物理存储结构
确定数据的物理存储结构,主要是确定数据库中各种数据(包括关系、日志、备份等)在计算机中的存放位置和存储结构。
确定数据的存放位置和存储结构需要综合考虑存取时间、存储空间利用率和维护代价3方面的因素。这3方面常常相互矛盾,需要进行权衡,选择一个折中方案。
1. 确定数据的存放位置
当计算机中包含多个磁盘时,确定存放位置的方法有以下4种:
(1)将表和索引放在不同的磁盘上。
(2)将比较大的表放在两个磁盘上。
(3)将日志文件、重要的系统备份文件与数据库对象(表、索引等)放在不同的磁盘上。
(4)对经常存取或存取时间要求较高的对象(如表、索引)应放在高速存储器(如硬盘)上;对存取频率小或存取时间要求低的对象(如数据库的数据备份和日志文件备份等只在故障恢复时使用),可以存放在低速存储设备上。
2. 确定系统配置
系统配置变量、存储分配参数有很多,这些参数值影响存取时间和存储空间的分配。在初始情况下,系统为这些变量赋了合理的默认值。但是这些默认值不一定适合每一种应用环境,在进行数据库的物理结构设计时,设计人员和数据库管理员需要根据具体的应用环境适当调整这些参数值,以改善系统的性能,使其最优化。
在进行物理结构设计时对系统配置变量的调整只是初步的,在系统运行时还要根据实际运行情况做进一步的参数调整,以改进系统性能。
5.5.4 评价物理结构
物理结构设计过程中,设计人员需要对时间效率、空间效率、维护代价和各种用户要求进行权衡,可能会产生多种设计方案。
数据库设计人员需要从存储空间、存取时间和维护代价等方面对各方案进行定量估算,比较估算结果,选择一个最佳的物理结构。
如果评价结果符合用户要求,则进行数据库实施。否则,设计人员需要修改设计,直到评价结果达到用户的预期结果为止。
需要强调的是,物理结构设计不是一蹴而就的,往往需要经过多次调试才能获得最优的设计结果。

展开更多......

收起↑

资源预览