资源简介 The Best R&D Courses文件管理 7.1 文件和文件系统 文件系统的管理功能是将其管理的程序和数据通过组织为一系列文件的方式实现的。而文件则是指具有文件名的若干相关元素的集合。元素通常是记录,而记录又是一组有意义的数据项的集合。可见,基于文件系统的概念,可以把数据组成分为数据项、记录和文件三级。The Best R&D Courses文件管理7.1.1 数据项、记录和文件 1. 数据项 在文件系统中,数据项是最低级的数据组织形式,可把它分成以下两种类型: (1) 基本数据项。 (2) 组合数据项。The Best R&D Courses文件管理 2. 记录 记录是一组相关数据项的集合,用于描述一个对象在某方面的属性。一个记录应包含哪些数据项,取决于需要描述对象的哪个方面。由于对象所处的环境不同可把他作为不同的对象。The Best R&D Courses文件管理 3. 文件 文件是指由创建者所定义的、具有文件名的一组相关元素的集合,可分为有结构文件和无结构文件两种。The Best R&D Courses文件管理图7-1 文件、记录和数据项之间的层次关系The Best R&D Courses文件管理7.1.2 文件名和类型 1. 文件名和扩展名 (1) 文件名。 (2) 扩展名。The Best R&D Courses文件管理 2. 文件类型 1) 按用途分类 根据文件的性质和用途的不同,可将文件分为三类: (1) 系统文件,这是指由系统软件构成的文件。大多数的系统文件只允许用户调用,但不允许用户去读,更不允许修改;有的系统文件不直接对用户开放。 (2) 用户文件,指由用户的源代码、目标文件、可执行文件或数据等所构成的文件。用户将这些文件委托给系统保管。 (3) 库文件,这是由标准子例程及常用的例程等所构成的文件。这类文件允许用户调用,但不允许修改。The Best R&D Courses文件管理 2) 按文件中数据的形式分类 按这种方式分类,也可把文件分为三类: (1) 源文件,这是指由源程序和数据构成的文件。通常,由终端或输入设备输入的源程序和数据所形成的文件都属于源文件。它通常是由ASCII码或汉字所组成的。 (2) 目标文件,这是指把源程序经过编译程序编译过,但尚未经过链接程序链接的目标代码所构成的文件。目标文件所使用的后缀名是“.obj”。 (3) 可执行文件,这是指把编译后所产生的目标代码经过链接程序链接后所形成的文件。其后缀名是 .exe。The Best R&D Courses文件管理 3) 按存取控制属性分类 根据系统管理员或用户所规定的存取控制属性,可将文件分为三类: (1) 只执行文件,该类文件只允许被核准的用户调用执行,不允许读和写。 (2) 只读文件,该类文件只允许文件主及被核准的用户去读,不允许写。 (3) 读写文件,这是指允许文件主和被核准的用户去读或写的文件。The Best R&D Courses文件管理 4) 按组织形式和处理方式分类 根据文件的组织形式和系统对其处理方式的不同,可将文件分为三类: (1) 普通文件。 (2) 目录文件。 (3) 特殊文件。The Best R&D Courses文件管理7.1.3 文件系统的层次结构 如图7-2所示,文件系统的模型可分为三个层次:最底层是对象及其属性,中间层是对对象进行操纵和管理的软件集合,最高层是文件系统提供给用户的接口。The Best R&D Courses文件管理图7-2 文件系统模型The Best R&D Courses文件管理 1. 对象及其属性 文件管理系统管理的对象如下: (1) 文件。 (2) 目录。 (3) 磁盘(磁带)存储空间。The Best R&D Courses文件管理 2. 对对象操纵和管理的软件集合 该层是文件管理系统的核心部分。文件系统的功能大多是在这一层实现的,其中包括有:① 对文件存储空间的管理;② 对文件目录的管理;③ 用于将文件的逻辑地址转换为物理地址的机制;④ 对文件读和写的管理;⑤ 对文件的共享与保护等功能。在实现这些功能时,OS通常都采取了层次组织结构,即在每一层中都包含了一定的功能,处于某个层次的软件,只能调用同层或更低层次中的功能模块。The Best R&D Courses文件管理 3. 文件系统的接口 为方便用户的使用,文件系统以接口的形式提供了一组对文件和记录操作的方法和手段。通常是下面两种类型的接口: (1) 命令接口,是指作为用户与文件系统直接交互的接口,用户可通过键盘终端键入命令取得文件系统的服务。 (2) 程序接口,是指作为用户程序与文件系统的接口,用户程序可通过系统调用取得文件系统的服务,例如,用于创建文件的系统调用Creat,用于打开一个文件的系统调用Open等。The Best R&D Courses文件管理7.1.4 文件操作 1. 最基本的文件操作 最基本的文件操作包含下述内容: (1) 创建文件。 (2) 删除文件。 (3) 读文件。 (4) 写文件。 (5) 设置文件的读/写位置。The Best R&D Courses文件管理 2. 文件的“打开”和“关闭”操作 当用户要求对一个文件实施多次读/写或其它操作时,每次都要从检索目录开始。为了避免多次重复地检索目录,在大多数OS中都引入了“打开”(open)这一文件系统调用,当用户第一次请求对某文件进行操作时,须先利用open系统调用将该文件打开。 The Best R&D Courses文件管理 3. 其它文件操作 OS为用户都提供了一系列文件操作的系统调用,其中最常用的一类是有关对文件属性的操作,即允许用户直接设置和获得文件的属性,如改变已存文件的文件名、改变文件的拥有者(文件主)、改变对文件的访问权,以及查询文件的状态(包括文件类型、大小和拥有者以及对文件的访问权等)。另一类是有关目录的操作,如创建一个目录,删除一个目录,改变当前目录和工作目录等。此外,还有用于实现文件共享的系统调用,以及用于对文件系统进行操作的系统调用等。The Best R&D Courses文件管理 7.2 文件的逻辑结构 (1) 文件的逻辑结构(File Logical Structure)。 (2) 文件的物理结构,又称为文件的存储结构。The Best R&D Courses文件管理7.2.1 文件逻辑结构的类型 对文件逻辑结构所提出的基本要求,首先是有助于提高对文件的检索速度,即在将大批记录组成文件时,应采用一种有利于提高检索记录速度和效率的逻辑结构形式。其次是该结构应方便对文件进行修改,即便于在文件中增加、删除和修改一个或多个记录。第三是降低文件存放在外存上的存储费用,即尽量减少文件占用的存储空间,不要求大片的连续存储空间。The Best R&D Courses文件管理 1. 按文件是否有结构分类 1) 有结构文件 (1) 定长记录。 (2) 变长记录。The Best R&D Courses文件管理 2) 无结构文件 如果说在大量的信息管理系统和数据库系统中,广泛采用了有结构的文件形式的话(即文件是由定长或变长记录构成的),那么在系统中运行的大量的源程序、可执行文件、库函数等,所采用的就是无结构的文件形式,即流式文件。其文件的长度是以字节为单位的。对流式文件的访问,则是利用读、写指针来指出下一个要访问的字符。可以把流式文件看做是记录式文件的一个特例:一个记录仅有一个字节。The Best R&D Courses文件管理 2. 按文件的组织方式分类 根据文件的组织方式,可把有结构文件分为三类: (1) 顺序文件。 (2) 索引文件。 (3) 索引顺序文件。The Best R&D Courses文件管理7.2.2 顺序文件(Sequential File) 1. 顺序文件的排列方式 在顺序文件中的记录,可以按照各种不同的顺序进行排列。一般地,可分为两种情况: (1) 串结构。 (2) 顺序结构。The Best R&D Courses文件管理 2. 顺序文件的优缺点 顺序文件的最佳应用场合是在对文件中的记录进行批量存取时(即每次要读或写一大批记录)。所有逻辑文件中顺序文件的存取效率是最高的。此外,对于顺序存储设备(如磁带),也只有顺序文件才能被存储并能有效地工作。The Best R&D Courses文件管理7.2.3 记录寻址 1. 隐式寻址方式 对于定长记录的顺序文件,如果已知当前记录的逻辑地址,便很容易确定下一个记录的逻辑地址。The Best R&D Courses文件管理 2. 显式寻址方式 该方式可用于对定长记录的文件实现直接或随机访问。因为任何记录的位置都很容易通过记录长度计算出来。而对于可变长度记录的文件则不能利用显式寻址方式实现直接或随机访问,必须增加适当的支持机构方能实现。下面我们通过两种方式对定长记录实现随机访问: (1) 通过文件中记录的位置。 (2) 利用关键字。The Best R&D Courses文件管理7.2.4 索引文件(Index File) 1. 按关键字建立索引 定长记录的文件可以通过简单的计算,很容易地实现随机查找。但变长记录文件查找一个记录必须从第一个记录查起,一直顺序查找到目标记录为止,耗时很长。The Best R&D Courses文件管理The Best R&D Courses文件管理 2. 具有多个索引表的索引文件 使用按关键字建立索引表的索引文件与顺序文件一样,都只能按该关键字进行检索。而实际应用情况往往是:不同的用户,为了不同的目的,希望能按不同的属性(或不同的关键字)来检索一条记录。为实现此要求,需要为顺序文件建立多个索引表,即为每一种可能成为检索条件的域(属性或关键字)都配置一张索引表。在每一个索引表中,都按相应的一种属性或关键字进行排序。The Best R&D Courses文件管理7.2.5 索引顺序文件 (Index Sequential File) 1. 索引顺序文件的特征 索引顺序文件是对顺序文件的一种改进,它基本上克服了变长记录的顺序文件不能随机访问,以及不便于记录的删除和插入的缺点。但它仍保留了顺序文件的关键特征,即记录是按关键字的顺序组织起来的。它又增加了两个新特征:一个是引入了文件索引表,通过该表可以实现对索引顺序文件的随机访问;另一个是增加了溢出(overflow)文件,用它来记录新增加的、删除的和修改的记录。The Best R&D Courses文件管理 2. 一级索引顺序文件 最简单的索引顺序文件只使用了一级索引。其具体的建立方法是,首先将变长记录顺序文件中的所有记录分为若干个组,如50个记录为一个组。然后为顺序文件建立一张索引表,并为每组中的第一个记录在索引表中建立一个索引项,其中含有该记录的关键字和指向该记录的指针。索引顺序文件是最常见的一种逻辑文件形式,如图7-5所示。The Best R&D Courses文件管理图7-5 索引顺序文件The Best R&D Courses文件管理 3. 两级索引顺序文件? 对于一个非常大的文件,为找到一个记录而须查找的记录数目仍然很多,例如,对于一个含有106个记录的顺序文件,当把它作为索引顺序文件时,为找到一个记录,平均须查找1000个记录。为了进一步提高检索效率,可以为顺序文件建立多级索引,即为索引文件再建立一张索引表,从而形成两级索引表。The Best R&D Courses文件管理7.2.6 直接文件和哈希文件 1. 直接文件 采用前述几种文件结构对记录进行存取时,都须利用给定的记录键值,先对线性表或链表进行检索,以找到指定记录的物理地址。然而对于直接文件,则可根据给定的关键字直接获得指定记录的物理地址。换而言之,关键字本身就决定了记录的物理地址。The Best R&D Courses文件管理 2. 哈希(Hash)文件 这是目前应用最为广泛的一种直接文件。它利用Hash函数(或称散列函数)可将关键字转换为相应记录的地址。但为了能实现文件存储空间的动态分配,通常由Hash函数所求得的并非是相应记录的地址,而是指向某一目录表相应表目的指针,该表目的内容指向相应记录所在的物理块,如图7-6所示。The Best R&D Courses文件管理图7-6 Hash文件的逻辑结构The Best R&D Courses文件管理 7.3 文 件 目 录 (1) 实现“按名存取”。 (2) 提高对目录的检索速度。 (3) 文件共享。 (4) 允许文件重名。The Best R&D Courses文件管理7.3.1 文件控制块和索引结点 1. 文件控制块FCB(File Control Block) 为了能对系统中的大量文件施以有效的管理,在文件控制块中,通常应含有三类信息,即基本信息、存取控制信息及使用信息。The Best R&D Courses文件管理 1) 基本信息类 基本信息类包括: (1) 文件名。 (2) 文件物理位置。 (3) 文件逻辑结构。 (4) 文件的物理结构。The Best R&D Courses文件管理 2) 存取控制信息类 存取控制信息类包括文件主的存取权限、核准用户的存取权限以及一般用户的存取权限。The Best R&D Courses文件管理 3) 使用信息类 使用信息类包括文件的建立日期和时间、文件上一次修改的日期和时间,以及当前使用信息。这些信息包括当前已打开该文件的进程数,是否被其它进程锁住,文件在内存中是否已被修改但尚未拷贝到盘上等。应该说明,对于不同OS的文件系统,由于功能不同,可能只含有上述信息中的某些部分。The Best R&D Courses文件管理图7-7 MS-DOS的文件控制块The Best R&D Courses文件管理 2. 索引结点 1) 索引结点的引入 文件目录通常是存放在磁盘上的,当文件很多时,文件目录可能要占用大量的盘块。在查找目录的过程中,必须先将存放目录文件的第一个盘块中的目录调入内存,然后将用户所给定的文件名,与目录项中的文件名逐一比较。若未找到指定文件,还需要将下一盘块的目录项调入内存。The Best R&D Courses文件管理图7-8 UNIX的文件目录The Best R&D Courses文件管理 2) 磁盘索引结点 这是存放在磁盘上的索引结点。每个文件有唯一的一个磁盘索引结点,它主要包括以下内容: (1) 文件主标识符,即拥有该文件的个人或小组的标识符; (2) 文件类型,包括正规文件、目录文件或特别文件; (3) 文件存取权限,指各类用户对该文件的存取权限; (4) 文件物理地址,每一个索引结点中含有13个地址项,即iaddr(0)~iaddr(12),它们以直接或间接方式给出数据文件所在盘块的编号;The Best R&D Courses文件管理 (5) 文件长度,指以字节为单位的文件长度; (6) 文件连接计数,表明在本文件系统中所有指向该(文件的)文件名的指针计数; (7) 文件存取时间,指出本文件最近被进程存取的时间、最近被修改的时间及索引结点最近被修改的时间。The Best R&D Courses文件管理 3) 内存索引结点 这是存放在内存中的索引结点。当文件被打开时,要将磁盘索引结点拷贝到内存的索引结点中,便于以后使用。在内存索引结点中又增加了以下内容: (1) 索引结点编号,用于标识内存索引结点; (2) 状态,指示i结点是否上锁或被修改; (3) 访问计数,每当有一进程要访问此i结点时,将该访问计数加1,访问完再减1; (4) 文件所属文件系统的逻辑设备号; (5) 链接指针,设置有分别指向空闲链表和散列队列的指针。The Best R&D Courses文件管理7.3.2 简单的文件目录 1. 单级文件目录 这是最简单的文件目录。在整个文件系统中只建立一张目录表,每个文件占一个目录项,目录项中含文件名、文件扩展名、文件长度、文件类型、文件物理地址以及其它文件属性。此外,为表明每个目录项是否空闲,又设置了一个状态位。单级文件目录如图7-9所示。The Best R&D Courses文件管理图7-9 单级文件目录The Best R&D Courses文件管理 2. 两级文件目录 为了克服单级文件目录所存在的缺点,可以为每一个用户再建立一个单独的用户文件目录UFD(User File Directory)。这些文件目录具有相似的结构,它由用户所有文件的文件控制块组成。此外,在系统中再建立一个主文件目录MFD(Master File Directory);在主文件目录中,每个用户目录文件都占有一个目录项,其目录项中包括用户名和指向该用户目录文件的指针。The Best R&D Courses文件管理图7-10 两级文件目录The Best R&D Courses文件管理7.3.3 树形结构目录(Tree-Structured Directory) 1. 树形目录 在现代OS中,最通用且实用的文件目录无疑是树形结构目录。它可以明显地提高对目录的检索速度和文件系统的性能。主目录在这里被称为根目录,在每个文件目录中,只能有一个根目录,每个文件和每个目录都只能有一个父目录。把数据文件称为树叶,其它的目录均作为树的结点,或称为子目录。图7-11示出了树形结构目录。The Best R&D Courses文件管理图7-11 多级目录结构The Best R&D Courses文件管理 7.4 文 件 共 享 在现代计算机系统中,必须提供文件共享手段,即指系统应允许多个用户(进程)共享同一份文件。这样,在系统中只需保留该共享文件的一份副本。如果系统不能提供文件共享功能,就意味着凡是需要该文件的用户,都须各自备有此文件的副本,显然这会造成对存储空间的极大浪费。The Best R&D Courses文件管理7.4.1 基于有向无循环图实现文件共享 1. 有向无循环图DAG(Directed Acyclic Graph) 在严格的树形结构目录中,每个文件只允许有一个父目录,父目录可以有效地拥有该文件,其它用户要想访问它,必须经过其属主目录来访问该文件。这就是说,对文件的共享是不对称的,或者说,树形结构目录是不适合文件共享的。如果允许一个文件可以有多个父目录,即有多个属于不同用户的多个目录,同时指向同一个文件,这样虽会破坏树的特性,但这些用户可用对称的方式实现文件共享,而不必再通过其属主目录来访问。The Best R&D Courses文件管理图7-13 有向无循环图目录层次The Best R&D Courses文件管理 2. 利用索引结点 为了解决这个问题,可以引用索引结点,即诸如文件的物理地址及其它的文件属性等信息,不再是放在目录项中,而是放在索引结点中。在文件目录中只设置文件名及指向相应索引结点的指针,如图7-14所示。The Best R&D Courses文件管理图7-14 基于索引结点的共享方式The Best R&D Courses文件管理7.4.2 利用符号链接实现文件共享 1. 利用符号链接(Symbolic Linking)的基本思想 利用符号链接实现文件共享的基本思想,是允许一个文件或子目录有多个父目录,但其中仅有一个作为主(属主)父目录,其它的几个父目录都是通过符号链接方式与之相链接的(简称链接父目录)。The Best R&D Courses文件管理2. 利用符号链实现共享的优点 在利用符号链方式实现文件共享时,只是文件主才拥有指向其索引结点的指针;而共享该文件的其他用户则只有该文件的路径名,并不拥有指向其索引结点的指针。这样,也就不会发生在文件主删除一共享文件后留下一悬空指针的情况。当文件的拥有者把一个共享文件删除后,如果其他用户又试图通过符号链去访问一个已被删除的共享文件,则会因系统找不到该文件而使访问失败,于是再将符号链删除,此时不会产生任何影响。The Best R&D Courses文件管理 3. 利用符号链的共享方式存在的问题 利用符号链的共享方式也存在着一些问题:当其他用户去读共享文件时,系统是根据给定的文件路径名逐个分量(名)地去查找目录,直至找到该文件的索引结点。因此,在每次访问共享文件时,都可能要多次地读盘。这使每次访问文件的开销甚大,且增加了启动磁盘的频率。此外,要为每个共享用户建立一条符号链,而由于链本身实际上是一个文件,尽管该文件非常简单,却仍要为它配置一个索引结点,这也要耗费一定的磁盘空间。The Best R&D CoursesThe Best R&D Courses 展开更多...... 收起↑ 资源预览