第1章 数据库基础 课件(共70张PPT)-《SQL Server数据库应用案例教程》同步教学(上海交通大学出版社)

资源下载
  1. 二一教育资源

第1章 数据库基础 课件(共70张PPT)-《SQL Server数据库应用案例教程》同步教学(上海交通大学出版社)

资源简介

(共70张PPT)
1
数据库基础


本章导读
随着信息技术的飞速发展,信息已成为当今社会各种活动的核心资源。通过对信息资源的开发利用,可以创造更大的信息价值。而对信息资源的开发利用离不开数据库技术的支持。
本章将介绍数据库的相关知识,包括数据库、数据库管理系统、数据库系统的基本概念,数据模型,数据库系统的结构,数据库系统设计和数据库领域的新技术等内容。
知识目标
掌握数据库的基础知识。
掌握数据模型的基础知识。
理解数据库系统的三级模式结构与二级映像等概念。
了解数据库系统设计的基本流程。
了解数据库领域的新技术。
能力目标
能够使用E-R图表示实体、属性、联系之间的关系。
素质目标
培养认真、规范的工作态度。
了解行业相关法律法规,培养严谨的工作作风。
项目导航
初识数据库
1
关系数据库
2
数据库系统的体系结构
3
数据库系统设计
4
数据库领域的性技术
5
01
初识数据库
1.1.1数据与数据处理1.数据与信息数据是对客观事物、事件的记录与描述,也是对客观事物的逻辑归纳。这种记录或描述可以是音频、图像,也可以是符号、文字等。数据与它的语义是密不可分的,语义指的是数据的含义。信息是对数据的解释,即“信息=数据+语义”。例如,有一条学生成绩信息为,信息学院计算机一班的张三同学在数据库原理及应用科目的考试中取得了95分的成绩。将这条信息转换成计算机中的数据,可以描述为(张三,信息学院,计算机一班,数据库原理及应用,95)。————数据处理是将数据转换成信息的过程,包括数据采集、管理、加工、变换和传输等一系列活动。数据管理是数据处理的核心,其过程较为复杂,主要包括数据的分类、组织、编码、存储、维护、检索等操作。数据处理的目的:其一是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据;其二是借助计算机科学地保存和管理大量复杂的数据,便于人们充分地利用这些信息资源。1.1.1数据与数据处理2.数据处理与数据管理——1.1.2数据库、数据库管理系统与数据库系统数据库1数据库(database, DB)是存储在计算机内,有组织的、可共享的相关数据的集合,这种集合按一定的数据模型组织、描述并长期存储,同时能够以安全可靠的方法对数据进行检索。数据库数据具有冗余度小、独立性高、延展性强、共享性好,以及结构化和永久性等特点。数据库管理系统2数据库管理系统(database management system, DBMS)是指能够创建、运用、管理和维护数据库,并且能够对数据库进行统一控制的系统软件。目前,常见的数据库管理系统有SQL Server、Oracle、MySQL与Access等。——1.1.2数据库、数据库管理系统与数据库系统数据库系统3数据库系统(databasesystem, DBS)是指在计算机系统中引入数据库后的系统。它主要由数据库、数据库用户、计算机硬件系统和计算机软件系统等几部分组成,如图1-1所示。图1-1数据库系统的组成——1.1.3数据库管理技术的发展1.人工管理阶段在20世纪50年代中期以前,计算机主要用于科学计算。当时的计算机硬件和软件都不完善,因此只能采用人工方式对数据进行管理。图1-2人工管理阶段应用程序与数据之间的对应关系人工管理阶段特点:人工管理阶段的数据无法保存。该阶段的数据无法共享,数据是面向应用程序的,一组数据只对应一个应用程序,如图1-2所示。——在20世纪50年代后期至60年代中期,计算机硬件和软件技术都得到了极大发展,计算机开始用于数据管理。文件系统优点:数据能够以文件的形式长期存储;文件系统提供的文件管理功能及存取方法,使得应用程序与数据具有了一定的独立性;文件形式多样化,数据间具有一定的共享性等。文件系统缺点:(1)数据共享性差,冗余度较大。(2)数据不一致性。(3)数据独立性差。(4)数据间联系弱。1.1.3数据库管理技术的发展2.文件系统阶段——1.1.3数据库管理技术的发展3.数据库系统阶段到了20世纪60年代后期,文件系统的数据管理方法无法适应各种应用程序的需要,于是数据库技术应运而生,人们转向使用数据库对数据进行统一管理。与文件系统相比,数据库系统阶段特点:(1)数据结构化。(2)数据共享性高、冗余度小。(3)数据独立性高。(4)有统一的数据管理和控制功能。图1-4数据库系统中的数据共享机制——1.1.4数据模型数据模型是对现实世界数据特征的抽象描述。现实世界中的数据要转换为抽象的数据库数据,需要经过现实世界、信息世界、计算机世界3个阶段,因此可以说数据模型是现实世界两级抽象的结果。数据模型按应用层次可分为概念模型、逻辑模型和物理模型。(1)概念模型也称为信息模型,是属于信息世界中的模型。它按照用户的目标对数据信息建模,是对现实世界的事物及其联系的第一级抽象。(2)逻辑模型属于计算机世界中的模型,它从计算机的角度对数据进行建模,是对现实世界的第二级抽象。(3)物理模型是对数据最底层的抽象,是面向计算机系统的模型,它描述数据在磁盘或磁带上的存储方式和存取方法。数据模型——1.1.4数据模型1.概念模型(1)实体(entity)。客观存在并且可以相互区别的事物称为实体。实体可以是具体的人、事或物,如一名学生、一本书或一所学校等;也可以是抽象的事件,如学生选课等。(2)属性(attribute)。实体所具有的某一特性称为属性。一个实体可以由多个属性刻画。例如,学生实体由学号、姓名、性别、年龄和系别等属性组成,它们共同构成了学生实体的特征。(3)实体型(entitytype)。一般用实体名及其属性名集合来抽象描述同类实体,这种描述称为实体型。例如,学生(学号,姓名,性别,年龄,系别)就是一个实体型,它描述的是学生这一类实体。(4)实体集(entity set)。同一类型实体的集合称为实体集。例如,所有学生就是一个实体集。(5)码(key)或称键、关键字、关键码等。在实体型中,能够唯一标识一个实体的属性或属性集称为实体的码。例如,学生的学号就是学生实体的码。——(6)域(domain)。某一属性的取值范围称为该属性的域。例如,学号的域为8位整数,性别的域为“男”和“女”等。(7)联系(relationship)。在现实世界中,事物内部及事物之间是有联系的,这些联系同样也要反映到信息世界中来。例如,学生的学号与姓名之间的联系,学生与课程之间的联系等。实体型之间的联系按照联系中实体的个数可分为3种情况:① 一对一联系(1∶1)。如图1-5所示。② 一对多联系(1∶n)。如图1-6所示。③ 多对多联系(m∶n)。如图1-7所示。图1-5一对一联系图1-6一对多联系图1-7多对多联系1.1.4数据模型1.概念模型——(8)E-R图。E-R图是陈品山于1976年提出的概念模型表示方法,也称实体-联系方法(entity-relationshipapproach),是目前最著名的概念模型表示方法。图1-8 E-R图表示实体与属性之间的关系E-R图能够清晰地表现出实体、属性和联系之间的关系。图1-9 E-R图表示两个实体集之间的3种联系1.1.4数据模型1.概念模型——图1-10多个或单个实体集之间的联系1.1.4数据模型1.概念模型——1.1.4数据模型2.逻辑模型层次模型1用树形结构表示实体类型及实体间联系的数据模型称为层次模型。如图1-11所示。结构特点:① 一个模型中有且只有一个节点没有父节点,这个节点称为根节点;② 根节点以外的其他节点有且只有一个父节点;③ 父子节点之间的联系是一对多联系(1∶n)。图1-11层次模型图例优点:①数据结构简单清晰,提供了良好的完整性支持;②结构间联系简单;③数据查询效率高。缺点:①不能直接表示两个以上实体集间的复杂联系;②不能表示实体集间的多对多联系;③不能用于表示非层次性的联系。——网状模型2网状模型在层次模型的基础上去掉了两个限制,可以更直接地描述现实世界中的信息,如图1-12所示。结构特点:① 允许一个以上的节点没有父节点;② 允许一个节点有多个父节点;③ 允许两个节点之间有多种联系。优点:比层次模型更好的性能和更高效的存储方式。缺点:数据结构比较复杂,数据模式和系统实现均不够理想。图1-12网状模型图例1.1.4数据模型2.逻辑模型——关系模型3在关系模型中,数据结构是一张规范化的二维表,每个二维表都可以称为关系,实体与实体之间的联系也用关系表示。不同于前两种模型,关系模型具有严格的数学理论依据,结构简单易懂,存取路径对用户透明,具有更高的数据独立性和安全保密性。面向对象模型4以面向对象的观点描述实体的逻辑组织、对象间限制与联系的模型是面向对象模型。这类模型具有抽象性、封装性、继承性和多态性等特性,是面向对象的思想与数据库技术相结合的产物,它能更完整地描述现实世界的数据结构,具有丰富的表达能力。但这类模型相对复杂,涉及知识比较多,目前普及程度不如关系模型。1.1.4数据模型2.逻辑模型——课堂小结① 数据与数据处理② 数据库、数据库管理系统与数据库系统③ 数据管理技术的发展④ 数据模型
02
关系数据库
——1.2.1关系模型1.关系模型的相关概念关系1通俗地讲,关系(relation)就是由行和列组成的二维表,二维表的名字就是关系的名字。例如,表1-1所示关系的名字就是teacher。tno(教师编号)tn(姓名)sex(性别)prof(职称)dept(系别)sal(工资)01001赵乾女讲师计算机600001002钱坤男讲师自动化600001003孙震女副教授自动化700002011李离女教授通信800002013周巽男教授计算机8000表1-1teacher(教师)——属性2二维表中的列称为属性(attribute),列名称为属性名,列中的值称为属性值。二维表中列的个数称为关系的元数。如果一个二维表有n列,则称其为n元关系。例如,表1-1所示关系teacher有tno,tn,sex,prof,dept,sal共6个属性,所以它是一个6元关系。域3域(domain)是一组具有相同数据类型的值的集合,又称值域(用D表示)。在关系中用域来表示属性的取值范围,域中所包含的值的个数称为域的基数(用m表示)。例如,表1-1中属性sex的域可表示为D={男,女},m=2。1.2.1关系模型1.关系模型的相关概念——元组4二维表中的行称为元组(tuple)。例如,表1-1中的(01001,赵乾,女,讲师,计算机,6000)就是一个元组。分量5一个元组中的每一个属性值,称为一个分量(component),n元关系的每个元组有n个分量。例如,元组(01001,赵乾,女,讲师,计算机,6000)中的“01001”为一个分量,此元组共有6个分量。1.2.1关系模型1.关系模型的相关概念——关系模式6二维表的结构称为关系模式(relation schema),或者说,关系模式就是二维表的框架(表头结构)。设关系名为R,其属性名分别为A1,A2,…,An,则关系模式可用如下公式表示:R(A1,A2,…,An)例如,表1-1的关系模式为teacher(tno,tn,sex,prof,dept,sal)。关系数据库7在一个给定的应用领域,所有实体及实体之间联系所对应的关系的集合构成一个关系数据库(relation database)。在关系数据库中,关系模式是型,关系是它的值。1.2.1关系模型1.关系模型的相关概念——1.2.1关系模型2.关系的性质列是同质的,即每一列中的分量必须来自同一个域且必须是同一类型的数据。1不同的属性可来自同一个域,但不同的属性有不同的名字。2列的顺序可以任意变换,但变换时应连同属性名一起交换,否则将得到不同的关系。3元组的顺序可任意变换。4关系中不允许出现相同的元组。5关系中的每一个分量必须是不可再分的数据项。6——1.2.1关系模型3.关系的码候选码。如果一个关系中的某属性或属性集的值可以唯一确定一个元组,则称该属性或属性集为候选码。候选码具有唯一性、最小性的特点。1例如,有一个学生关系(学号,姓名,性别,系别)与选课关系(学号,姓名,课程编号,成绩)。其中,学号能够唯一标识一个学生,则属性“学号”是学生关系的候选码,每一个学生的学号都是唯一的,这体现了候选码的唯一性;在选课关系中,只有属性集(学号,课程编号)才能唯一标识一条选课信息,则属性集(学号,课程编号)为选课关系的候选码,从中去掉任一属性都无法唯一标识一个选课元组,这体现了候选码的最小性。——主码。如果一个关系中有多个候选码,可以从中选定一个作为元组标识,称为主码或主键。2提示主码是关系模型中的一个重要概念,每个关系必须选择一个主码,选定之后不能随意改变。例如,在没有重名学生的情况下,学生关系中的属性“学号”与“姓名”都是学生关系的候选码。如果选定属性“学号”作为数据操作的依据,则属性“学号”为主码;如果选定属性“姓名”作为数据操作的依据,则属性“姓名”为主码。1.2.1关系模型3.关系的码——主属性与非主属性。包含在任一候选码中的属性称为主属性,不包含在任一候选码中的属性称为非主属性。3例如,在没有重名学生的情况下,学生关系的属性“学号”与“姓名”都是学生关系的候选码,则它们都是学生关系的主属性。而属性“性别”与“系别”不包含在任一候选码中,则它们都是学生关系的非主属性。在最简单的情况下,关系的候选码只包含一个属性;在最极端的情况下,关系的候选码是所有属性的组合,此时称为全码。1.2.1关系模型3.关系的码——外码。如果一个关系R1中的主码所对应的属性或属性集X还存在于另一个关系R2中,则称这个属性或属性集X为R2的外码,也称外键。4高手点拨在一个数据库中,如果两个实体的候选码中有共同的属性或属性集X,为了避免系统错误及数据冗余等问题,一般不将X同时选为这两个实体的主码。如果两个实体的主码相同,可将这两个实体的关系合并为一个关系。1.2.1关系模型3.关系的码——1.2.2关系数据库的规范化理论1.函数的依赖函数依赖是关系模式中属性之间的依赖关系。例如,设有一个学生成绩关系(学号,姓名,性别,班级编号,课程编号,课程名称,成绩)表示为sgrade(sno,sn,sex,classno,cno,cn,grade)。其中,属性sno与sn、sex及classno之间存在着一种依赖关系,即当sno的值确定之后,其余3个属性的值也随之唯一地确定。设关系模式R(U),U是属性集,X和Y是U的子集,如果对于R(U)的任一关系r,X的每一个具体值,Y都有唯一的具体值与之对应,则称X函数确定Y,或Y函数依赖于X,记作X→Y。其中,X称为决定因子,Y称为依赖因子。当Y不依赖于X时,记作X Y;当X→Y且Y→X时,则记作X Y。函数依赖的定义——下面对上述定义进行几点说明。(1)对于r的任意两个元组t1和t2,只要t1[X]=t2[X],就有t1[Y]=t2[Y]。(2)函数依赖不是关系模式中某个或某些关系实例的约束条件,而是整个关系模式中所有关系实例都要满足的约束条件。(3)函数依赖与属性之间的联系有关,具体表现在如下几个方面(以上述关系模式sgrade为例进行说明)。① 当属性X与属性Y具有1∶1联系时,存在函数依赖X→Y,Y→X,即X Y。② 当属性X与属性Y具有n∶1联系时,存在函数依赖X→Y,且Y X。③ 当属性X与属性Y具有m∶n联系时,X与Y之间不存在任何函数依赖。(4)函数依赖是语义范畴的概念,必须根据语义定义属性之间的函数依赖,而不能凭某一时刻的实际数值来判断,关系中元组的更新或删除都不应该破坏这种函数依赖。1.2.2关系数据库的规范化理论1.函数的依赖——(5)函数依赖的类型。函数依赖的类型可分为完全函数依赖、部分函数依赖与传递函数依赖3种。① 完全函数依赖。设在R(U)中,X→Y,且对于X的任何一个真子集X′,都有X′ Y,则称Y对X完全函数依赖(full functional dependency),记作X→Y。② 部分函数依赖。设在R(U)中,X→Y,且对于X的某一个真子集X′,有X′→Y,则称Y对X部分函数依赖(partial functional dependency),记作X→Y。③ 传递函数依赖。设在R(U)中,X→Y(X不包含Y),但Y X,而Y→Z(Y不包含Z),则称Z对X传递函数依赖(transitive functional dependency),记作X→Z。fp1.2.2关系数据库的规范化理论1.函数的依赖——1.2.2关系数据库的规范化理论2.范式范式(normal forms, NF)是关系模式规范化的标准,不同的范式设定了不同程度的规范化要求。在关系数据库规范中形成了一系列不同的范式,它们之间的包含关系可以表示为:5NF 4NF BCNF 3NF 2NF 1NF。第一范式。1如果关系模式R的所有属性均是不可再分的单一项,则称R属于第一范式,记作R∈1NF。第二范式。2如果关系模式R∈1NF,且每个非主属性都完全依赖于R的主码,则R属于第二范式,记作R∈2NF。——将1NF的关系模式规范化到2NF的具体步骤如下。① 将主码的所有子集分别作为主码重新构建关系模式。② 将非主属性依次放到相应的关系模式中。③ 去掉仅由主属性构成的关系模式。1.2.2关系数据库的规范化理论2.范式——【例1-1】将关系模式选课(学号,课程号,姓名,成绩)规范化为2NF。【解】① 由语义可知主码为(学号,课程号),将这一属性组合的子集作为主码分别构建关系模式:R1(学号,…),R2(课程号,…),R3(学号,课程号,…)。② 将非主属性依次放入相应的关系模式中:R1(学号,姓名),R2(课程号),R3(学号,课程号,成绩)。③ 去掉仅由主属性构成的关系模式R2,所剩的R1和R3即属于2NF的关系模式,将它们重新命名可得:学生(学号,姓名),选课(学号,课程号,成绩)。1.2.2关系数据库的规范化理论2.范式——第三范式。3如果关系模式R∈2NF,且每个非主属性都不传递依赖于R的主码,则R属于第三范式,记作R∈3NF。将2NF的关系模式规范化到3NF的具体步骤如下。① 将关系模式中非主属性的依赖因子删除,即删除依赖于非主属性的属性。② 新建关系模式,放入删除掉的依赖因子及其决定因子。1.2.2关系数据库的规范化理论2.范式——【例1-2】将关系模式学生(学号,姓名,系别,系主任)规范化到3NF。【解】① 由语义可知,属性“系主任”函数依赖于非主属性“系别”,所以将属性“系主任”从关系模式学生中删除,得到学生(学号,姓名,系别)。② 新建一个关系模式系管理,放入上一步中删除的依赖因子“系主任”及其决定因子“系别”,得到系管理(系别,系主任)。此时,这两个关系模式都属于3NF。1.2.2关系数据库的规范化理论2.范式——课堂小结① 关系模型② 关系数据库的规范化理论
03
数据库系统的
体系结构
——1.3.1数据库系统的三级模式结构图1-13三级模式结构和二级映像功能数据库系统的三级模式结构从逻辑上分为外模式、模式和内模式三级抽象模式,并提供外模式/模式、模式/内模式二级映像。——1.3.1数据库系统的三级模式结构外模式1外模式又称子模式或用户模式,它是三级结构的最外层,是数据库用户能够看到并允许使用的那部分数据的逻辑结构和特征的描述,是数据库用户的数据视图。外模式是模式的子集,一个数据库可以有多个外模式。用户可以根据系统所给的外模式,用查询语言或应用程序去操作部分数据,数据库中的其余数据对于用户来说是不可见的,所以外模式也是保证数据库安全的一种有力措施。模式2模式也称为概念模式或概念视图,是数据库中全体数据的逻辑结构和特征的描述,处于三级模式结构的中间层,不涉及数据的物理存储和硬件环境,同时与开发工具及程序设计语言无关。一个数据库只有一个模式,模式是数据的逻辑表示,它描述了数据库中存储的具体数据及其之间存在的联系。——1.3.1数据库系统的三级模式结构内模式3内模式又称存储模式或物理模式,是三层结构中的最内层,也是最靠近物理存储的一层。它是对数据库存储结构的描述,是数据在数据库内部的表达方式。高手点拨一个数据库系统,实际存在的只有物理级数据库,也就是内模式,它是数据访问的基础。概念级数据库是物理级数据库的一种抽象描述,用户级数据库是用户与数据库的接口。用户根据外模式进行的操作,通过外模式到模式的映射与概念级数据库联系起来,又通过模式到内模式的映射与物理级数据库联系起来。实际上,DBMS的工作之一就是完成三级数据库模式之间的转换,把用户对数据库的操作转化到物理层面去执行。在数据库系统中,外模式可以有多个,但是模式与内模式只能各有一个。——1.3.2数据库系统的二级映像外模式/模式映像1数据库的模式可以对应任意多个外模式,对于每一个外模式,都存在一个外模式/模式映像。当一个关系的逻辑结构(模式)发生变化时,由数据库管理员对外模式/模式映像做出相应改变,就可以保证外模式不变。模式/内模式映像2数据库中只有一个模式和一个内模式,所以模式/内模式映像是唯一的。模式/内模式映像定义了数据的全局逻辑结构与存储结构,也就是模式与内模式之间的关系。当数据的存储结构发生变化,只需数据库管理员对模式/内模式映像做出相应的改变,就能使模式保持不变,从而使应用程序也不用发生改变,确保了数据的物理独立性。——课堂小结① 数据库系统的三级模式结构② 数据库系统的二级映像
04
数据库系统设计
——1.4数据库系统设计按照结构化系统设计的方法,将一个数据库系统从无到有地设计出来并投入使用,需要经历如下6个阶段,如图1-14所示。图1-14数据库设计步骤1.4数据库系统设计——需求分析阶段1概念结构设计阶段2逻辑结构设计阶段3物理结构设计阶段4数据库实施阶段5数据库运行与维护阶段6需求分析的准确性决定了构建数据库的速度与质量。将概念模型转换为具体某个数据库管理系统所支持的逻辑数据模型,并对其进行优化。根据逻辑结构和物理结构建立数据库,编写与调试应用程序,把原始数据装入数据库并进行试运行。通过对用户的需求进行综合归纳与抽象,形成一个独立于具体数据库管理系统之外的概念模型。为逻辑数据模型选取一个最适合应用需求的物理结构,包括存储结构和存取方法等。在运行过程中还需要不断对其进行评估、调整与修改,以保证数据库系统的性能与安全。1.4.1需求分析阶段——需求分析的方法1需求分析的步骤2常用的需求分析方法为自顶向下分析法,也称结构化分析方法(structured analysis, SA)。这是最简单实用的方法,即从最上层的系统结构入手,逐层分析系统。(1)调查、分析所处理对象的现状,包括了解组织的部门组成情况、各部门的职责等,为分析信息流程做好准备。(2)调查各部门的业务活动情况,包括了解各部门使用什么类型的数据,如何加工处理这些数据,输出什么信息,输出到什么部门,输出结果的格式等信息。(3)在熟悉业务活动的基础上,协助用户明确对系统的各种要求,包括信息要求、处理要求、安全性与完整性要求。(4)确定系统的边界。对前面调查的结果进行初步分析,确定应该由计算机实现的功能。1.4.2概念结构设计阶段——概念结构设计的方法1概念结构设计的步骤2(1)自顶向下的设计方法。(2)自底向上的设计方法。(3)由里向外逐步扩张的设计方法。(4)混合策略的设计方法。(1)进行数据抽象,设计局部E-R模型。(2)集成各局部E-R模型,形成全局E-R模型。1.4.3逻辑结构设计阶段——逻辑结构设计的任务是,把概念结构设计阶段设计好的E-R图转换为所选用的数据库管理系统支持的逻辑结构。在逻辑结构设计阶段,首先需要将概念结构设计阶段设计的E-R图转换为一般的逻辑模型(层次、网状、关系等),然后对其进行优化。E-R图向关系模型转换需要确定如何将实体、实体的属性及实体之间的联系转换为关系。一般来说,转换原则为,一个实体转换为一个关系,实体的属性就是关系的属性,实体的码就是关系的码。得到初步的数据模型后,还需要以规范化理论为依据对其进行调整、优化,得到最终的逻辑模型。1.4.4物理结构设计阶段——物理结构设计阶段需要为设计好的逻辑模型选取一个最符合要求的物理结构,包括数据库在物理设备上的存取方法和存储结构。在确定数据库的物理结构之前,设计人员必须详细了解选定数据库管理系统的功能和特点,熟悉应用环境,了解应用系统各部分的使用要求,并把它们作为平衡物理空间分配的依据。物理结构设计过程中需要考虑许多因素,如时间和空间效率、维护代价与用户要求等,对这些因素进行权衡,可能会产生多种设计方案。此时就需要对设计方案进行评价,从中选出较优的方案。1.4.5数据库实施阶段——建立数据库结构1装入数据2建立数据库结构可以使用数据定义语言,也可以使用图形化管理工具。装入数据又称为数据库加载(loading),是数据库实施阶段的一项重要工作。对于一般的小型系统,装入的数据量较少,可以采用人工输入的方式完成。对于规模较大的系统,一般使用计算机来完成这项工作,常用的方法是设计一个数据输入子系统。1.4.5数据库实施阶段——应用程序的编码与调试3装入数据4应用程序的设计应该与数据库设计同步进行,也就是说,在数据入库的过程中需要同时调试应用程序。应用程序编写完成并输入一部分数据之后,就可以试运行数据库。这一阶段需要完成功能和性能上的测试。有些系统设计的参数只有在试运行之后才能得到,如果测试结果不符合设计目标,则应该返回之前的设计步骤修改或调整结构。整理文档5在程序的编码调试及数据库试运行过程中,应该将发现的问题及解决方法整理成文档资料,以供正式运行或改进时参考使用。1.4.6数据库运行与维护阶段——在试运行结果符合设计目标后,数据库即投入正式运行。进入运行阶段,标志着数据库应用开发的工作基本结束,但设计过程并未结束。随着应用环境的变化,用户的需求及处理方法不断发展,数据在运行过程中的存储结构也会发生变化,所以需要继续对应用程序进行修改扩充,包括维护数据库的安全性与完整性,检测并改善数据库性能等,在必要时还需要重新组织和构造数据库。 ——课堂总结① 需求分析阶段② 概念结构设计阶段③ 逻辑结构设计阶段④ 物理结构设计阶段⑤ 数据库实施阶段⑥ 数据库运行与维护阶段
05
数据库领域的新技术
——1.5.1云数据库与分布式数据库1.云数据库云数据库(cloud database)是指被优化或部署到一个虚拟计算环境中的数据库。具有按需付费、按需扩展、高可用性及方便存储整合等优势。将一个现有的数据库优化到云环境,有如下几点好处。(1)可以使用户按照存储容量和带宽的需求付费。(2)提高数据库的可移植性。(3)可实现按需扩展。(4)实现高可用性。——1.5.1云数据库与分布式数据库2.分布式数据库分布式数据库(distributed database)是指数据分别存储在计算机网络中的各台计算机上的数据库。分布式数据库相对传统集中式数据库具有更高的数据访问速度、更强的可扩展性和更高的并发访问量等优点。拓展阅读云数据库与分布式数据库具有相似之处,如都把数据存放在不同的节点上,但是分布式数据库在可扩展方面是无法与云数据库相比的。分布式数据库因为要考虑数据同步和分区失败等情况,节点的增加会导致性能快速下降,而云数据库在设计时就考虑了会影响可扩展性的因素,采取了许多措施,如使用更简单的数据模型,对元数据和应用数据进行分离等,使自身的可扩展性不受影响。——1.5.2大数据与主动数据库1.大数据大数据(big data)也称海量数据或巨量数据,是指数据量大到无法利用传统数据处理技术在合理的时间内获取、存储、管理和分析的数据集合。根据大数据的处理流程,可以将其关键技术分为大数据采集、大数据预处理、大数据存储与管理、大数据分析与挖掘、大数据可视化展现等。大数据采集1将数据写入数据仓库,整合在一起,以便对它们进行综合分析。大数据预处理2将杂乱无章的数据转化为相对单一且便于处理的数据,或者去除没有价值甚至可能对分析造成干扰的数据(数据清洗),从而为后期的数据分析奠定基础。——大数据存储与管理3用存储器把采集到的数据存储起来,并建立相应的数据库,以便对数据进行管理和调用。大数据分析与挖掘4通过各种算法从大量的数据中找出潜在的有用信息,并研究数据的内在规律和相互间的关系。大数据可视化展现5利用可视化手段对数据进行分析,并将分析结果用图表或文字等形式展现出来,从而使读者对数据的分布、发展趋势、相关性和统计信息等一目了然。1.5.2大数据与主动数据库1.大数据——拓展阅读随着网络应用的普及与大数据技术的发展,各种网站会将用户不经意间泄露的数据全部收集起来,通过大数据技术整合之后,清晰地描绘出每个用户的“人物画像”,即用户的购买需求、消费倾向及使用习惯等,然后利用这些信息对用户进行精准营销,以获取更多利益。为了保护容易泄露信息的新型劳动者,多部委于2021年7月联合签署了《关于维护新就业形态劳动者劳动保障权益的指导意见》。随后,为进一步保护所有人的信息安全,2021年8月十三届全国人民代表大会常务委员会第三十次会议通过了《中华人民共和国个人信息保护法》,主要针对信息骚扰、“大数据杀熟”等问题,全方位构筑起个人信息保护的“金钟罩”。1.5.2大数据与主动数据库1.大数据——1.5.2大数据与主动数据库2.主动数据库主动数据库(active database)是指在没有用户干预的情况下,能够主动对系统内部或外部所发生的事件做出反应的数据库,是数据库技术与人工智能技术相结合的产物。与传统数据库系统相比,主动数据库最大的特点就是让数据库系统具有主动服务的功能,并以一种统一的机制来实现各种主动服务需求。虽然主动数据库还有待发展,但其已经在计算机集成制造、网络管理和办公自动化等领域有了广泛的应用。——1.5.3数据仓库与数据挖掘1.数据仓库数据仓库(data warehouse)是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,通常用于辅助决策支持。(1)面向主题。(2)集成性。(3)相对稳定。(4)反映历史变化。数据仓库的特点——1.5.3数据仓库与数据挖掘2.数据挖掘数据挖掘(data mining)是从大量数据中获取有效的、新颖的、有潜在价值的信息的非平凡过程,也称为知识发现。简单来讲,数据挖掘就是从大量数据中提取或“挖掘”知识。数据挖掘是交叉性学科,它是数据库技术、机器学习、统计学、人工智能、可视化分析和模式识别等多门学科的融合。它把现代企业中的原始数据转换为人工智能的来源,对数据进行操纵,提供可靠的、可以用来决策的信息。——实战训练1.实战要求(1)根据实际业务进行需求分析。(2)根据需求分析进行概念结构设计,画出E-R图。(3)根据概念结构设计进行逻辑结构设计,将E-R图转换为逻辑模型。2.实战内容设有一订货管理系统,具有展示各类商品信息及订购商品的功能。客户选择商品并提交后生成订单,完成订货的业务。现根据这一系统要求完成下列实战内容。(1)需求分析。首先对业务流程进行调查分析,根据业务需求绘制数据流图。分析得出其业务流程为,登录→浏览商品→添加商品→提交订单→生成订单。——实战训练(2)概念结构设计。建立局部E-R图,再通过合并优化获得全局E-R图。建立局部E-R图之前,需先分析实体间的语义约束,即一个客户可以订购多个商品,一个商品可以被多个客户订购,因此,客户和商品之间是多对多关系。将约束中提到的数据结构转换为E-R图中的实体及其属性,联系转换为E-R图中的联系,并组合成全局E-R图,如图1-15所示。图1-15全局E-R图——实战训练(3)转换逻辑模型。根据E-R图所示实体与联系,列出如下3个关系模型。其中,订购联系需结合实际添加自身相关属性。商品(商品编号,商品名称,商品价格,库存数量,生产日期)客户(客户编号,客户名称,联系电话,联系地址)订购(订单编号,客户编号,商品编号,订购数量,订购时间)——课堂总结① 云数据库与分布式数据库② 大数据与主动数据库③ 数据仓库与数据挖掘

展开更多......

收起↑

资源预览