资源简介 (共46张PPT)第六章 多媒体信息的组织管理与查询学习目的: 通过本章的学习,要求学生掌握超文本和超媒体技术并对多媒体数据库及基本内容检索技术有初步的了解。这些技术能为人们提供简单、直观、快捷、灵活的数据表式、组织和管理手段。它所提供的思想方法可建立各种媒体信息之间的网状链接结构,与传统的线性文本结构有着很大的不同,符合人们的“联想”是逻辑思维习惯。学习的知识点: 超文本和超媒体的基本概念、主要特点和基本特性 超文本的体系结构层次、组成要素 超文本系统与操作工具 超文本和超媒体的应用,以及超文本和超媒体存在的问题和发展前景 多媒体数据库的基本功能与体系结构 基本内容检索的体系结构,关键技术与设计实现学习要求: 掌握:超文本和超媒体的基本概念、主要特性和体系结构以及超文本和超媒体组成要素 理解:超文本和超媒体的应用及研究的问题 了解:多媒体数据库及基本内容检索目录: 6.1 超文本和超媒体 6.2 多媒体数据库 6.3 基于内容检索6.1 超文本和超媒体一.概述 1945年,有人提出超文本的概念,由于当时科学技术水平限制,一直没有得到发展。1968年,用超文本文档建立的Augment系统问世。1987年,Apple公司推出HyperCard软件,引起了人们的重视。超文本(Hypertext)是一种典型的数据库技术,它以结点为单位组织多媒体信息,在结点之间通过关系型链加以连接,构成表达特定内容的信息网络。用户可对网络进行浏览、查询、注释等操作。超文本不是顺序的,而是一个非线性的网状结构。 超文本是由若干内部互连的的文本块(或其它信息)组成。这些信息块可以是计算机的若干屏,也可以是若干窗口、文件或更小的信息块。这样一个信息单元就称为一个结点(Node)。一个结点可以是一个信息块,也可以是若干结点组成的一个信息块。每个结点都有若干指向其他结点或从其他结点指向该结点的指针,这些指针被称为链(Link)。超文本的主要特点 (1)多媒体信息:超文本的基本信息单元是结点,它可以包含文本、图形、图像、动画、音频和视频等多种媒体信息,而且它的信息表现方式和大小等都可根据所要表述的主题自由选择、组合,不需要严格的定义。 (2)网络结构形式:超文本从整体来讲是一种网络的信息结构形式,按照信息在现实世界中的自然联系以及人们的逻辑思维方式有机地组织信息,使其表达的信息更接近现实生活。 (3)交互特性:信息的多媒体化和网络化是超文本静态组织信息的特点,而交互性是人们在浏览超媒体时最重要的动态特征。超文本系统是能对超文本进行管理和使用的系统。超文本和超文本系统的关系和数据库与数据库管理系统类似。超文本系统一般有以下特点 (1)在用户界面中包括对超文本的网络结构的一个显示表示,即向用户展示结点和链的形式。 (2)给用户一个网络结构的动态总貌图,使用户在每一时刻都可以得到当前结点的邻接环境。 (3)超文本系统一般使用双向链,这种链应支持跨越各种计算机网络,如局域网和因特网。 (4)用户可以通过自己思想的联想及感知,根据自己的需要动态地改变网络中的结点和链,以便对网络中的信息进行快速、直观、灵活的访问。 (5)尽可能不信赖它的具体特性、命令或信息结构,而更多地强调它的用户界面的“视觉和感觉”。二.超文本和超媒体系统的组成和结构1.超文本和超媒体的组成要素当将超文本系统与多媒体技术结合起来,就是超媒体(Hypermedia)系统。 超文本可以看成由结点、链、网络三个要素的组成。(1)结点 结点是围绕一个特殊主题组织起来的数据集合,这个集合可以是有形的,也可以是无形的。当我们将一篇文章进行分割成若干块,这些块就是有形的结点。若对文章不进行分解,而只是根据需要对相应的内容进行定位,这个定位周围的信息就是一个无形的结点。结点可以嵌入链,使它能与其他结点相连接。结点间链接时,起始结点称为引用结点(Reference Node),终止结点称为目的结点(Referent Node),有时又称为锚结点(Anchor Node)。结点的内容可以通过点击链加以显示。结点有许多种媒体类结点 存放各种媒体信息,包括文本、图像、图形、音频、视频、动画等各种媒体,也包括数据库、文献,及存放这些媒体信息的来源、属性和表现方法等。动作类结点 动作和操作也是一种媒体,这是一种动态结点,它通过超媒体的按钮来访问,又称为按钮结点。动作和操作并一定是专门的结点,它可以嵌入到任何结点中,按钮也一般都与链相连接,只不过动作和操作的按钮连接的是执行链。组织型结点 是组织结点的结点,包括各种媒体的结点目录结点和索引结点。用于实现部分查询功能。推理型结点 用于辅助链的推理与计算,包括对象结点和规则结点。(2)链 链又称为超链(Hyperlink),是结点间的信息联系,它是以某种形式将一个结点与其他结点连接起来。链是有向的,一般结构可分为三个部分:链源、链宿和链的属性。链源是导致浏览过程中结点迁移的原因,可以是热标、媒体对象或结点等。链宿是链的目的所在,可以是结点,也可以是其他任何媒体内容。链的属性决定了链的类型,链的类型是链的主要属性。除此之外,链还有一般属性,例如,链的版本、权限等。典型链的类型基本结构链 构成超媒体的主要形式,必须在建立一个超媒体文献时事先由作者指明,是一种实链。基本结构链包括基本链、交叉索引链和结点内注释链。基本链 它是建立结点之间基本顺序的链。它使信息总体上呈现出层次结构。基本链的链源和链宿都是结点。在表现时常用“上一个结点”、“下一个结点”等来表现结点的先后顺序,也就是链的方向。基本链决定结点间的固定顺序。交叉索引链 它将结点链接成交叉的网状结构。交叉索引链的链源可以是各种热标、单媒体对象及按钮,链宿为结点或任何内容。在表现时常常用热标激活转移,“回退”、“返回”等表示先后顺序。与基本链不同的是,交叉索引链接的动作决定的是访问顺序。结点内注释链 是一种指向结点内部附加注释信息的链,注释链主要通过热标确定,注释体则为一单媒体对象。其链源和链宿均在同一结点内。采用结点内注释链的好处是不用另设结点,在需要时注释才出现。组织链和推理链 组织链用于结点的组织,推理链则在链的迁移过程中通过推理来决定目标。索引链 将用户从一个索引结点链接到该结点相应的索引入口。索引用于文献与数据为库的接口及查找共享同一索引项的文献,按钮表现常是“总目录”、“索引”等。执行链 将一种执行活动与按钮结点相连。执行链使应用程序不再孤立,可以激发一个动作或操作。其他链型 自动链接 允许系统自动把当前结点与相似主题或满足某些条件的所有其他结点链接在一起。类型链(3)热标(Hotspot) 热标是确定信息关联的链源,由它将引向相关的内容的转移。根据媒体类型的不同,热标的形式一般的以下几种: 热字(hot-word)是文本中被指定的有特殊含义或需要进一步解释的字、词或词组。触发这些词将会按照设计的安排出现相应的进一步解释,或是出现更形象的演示,或是转移相关内容显示。 热区(hot-area)是在所显示的图像或类似于图像显示区上指明的一个特定区域,作为触发转移的源点。 热元(hot-element)是将相对独立的图形单位作为转移的链源。其特点是,当图形单位移位后,仍能引发相应的信息,此点是热区或热字无法做到的。 热点(hot-point)主要用于时基媒体如动态视频、声音等在时间轴上的触发转移。 热属性(hot-attribution)是将关系数据库的属性作为热源。用特定的保留属性字的方法指明热字的热标的方法。(4)宏结点 通过链连接在一起的结点群称为宏结点。实际上一个宏结点就是超文本网络的一个有某种共同特征的子集。如右图中虚线框中的结点和链组成了宏结点,宏结点与宏结点之间用实线连接,表示了它们之间的物理关系,实际上位于不同宏结点内的结点在逻辑上可以有任意的连接(图中的虚线)。 宏结点的概念非常有用,因为当超文本系统十分巨大时,或分散在各个物理地点上时,仅通过一个层次的超文本网络管理很复杂,因此分层是简化网络拓扑结构最有效的方法。 宏结点的引入虽然简化了网络结构,便却增加了管理和检索的层次。基于宏结点和超文本系统的文献的查询和检索也是研究的主要问题之一,现已推出了许多模型系统。2.超文本和超媒体系统结构模型 超文本与超媒体系统就是超文本或超媒体的软硬件的总称。在Combell和Goodman提出的超文本抽象机(Hypertext Abstract Machine,HAM)模型中,把超文本系统划分为3个层次:表现层——用户接口,超文本抽象机层——结点和链,数据库层——存储、共享数据和网络访问。Dexter研究小组提出了一种Dexter参考模型。与HAM相比较,Dexter模型除了术语不同并且更加明确了层次之间的接口之外,与HAM模型基本相似。HAM模型 超文本和超媒体系统中数据库,由于具有多媒体数据所以信息量很大,因此用于大容量的存储技术,如大容量的磁盘、光盘等。而传统的数据库信息量没有那么大,而且信息量比较单一,一般都是文档或数据等。但是在超文本和超媒体的数据层的设计中也用到了大量的传统数据库的思想方法。三.超文本与超媒体存在的问题及应用环境1.超文本与超媒体存在的问题 (1)信息组织 超文本的信息组织是以结点为单位的,如何将一个复杂的信息系统信息块是一个较困难的问题,如何来组织安排而不破坏原有内容的表达。另外有些内容可能不适合组成超文本的形式,还有一个是超文本系统没有提供工具来帮助用户完成信息的划分工作。 (2)智能化 大多数超文本系统提供了许多帮助用户阅读的辅助信息和直观表示。这样超文本系统的控制权完全交给了用户,当用户接触到一个不熟悉的主题时,可能会产生网络上的迷航现象。超文本需要一种智能化,而不是被动地沿链跳转。(3)数据转换 超文本系统数据的组织与现有数据库文件系统的格式完全不一致。如何将传统的数据库数据转换到超文本中去是超文本中的一个问题。 (4)标准的统一 超文本系统大都根据用户的要求分别设计,它们之间没有考虑到兼容性的问题,也没有统一的标准。这样会造成不同的超文本系统之间不能沟通和共享。 (5)扩充性 现有的超文本系统检索和查询速度有待提高,信息管理结构和组织的灵活性有待增强,以便提供方便的系统扩充手段。 (6)媒体间协调性 超文本向超媒体的发展也带来一系列需要深入研究的问题,如多媒体数据如何组织,各种媒体间如何协调,结点和链如何表示;当各种媒体数据作为结点和链的内容时,媒体时间与空间的划分,内容安排的合理性问题等都是在多媒体数据模型建立时要认真解决的问题。2.超文本与超媒体应用环境 超文本的应用环境从低层到高层依次为硬件、操作系统、开发环境(超文本系统)、应用系统。其开发环境多媒体应用软件写作工具由编辑器、编辑器和阅读器三部分组成。 (1)编辑器:主要帮助用户建立、修改信息网络中的结点和链。 (2)编译器:综合编译编辑器定义的结点信息、结点流程以及利用系统工具准备的各种媒体信息,生成包括全部内容信息和结构信息的有机体——超文本文档。 (3)阅读器:一个用于浏览超文本文档的专门工具。 一般来说,超文本应用系统的开发环境和运行环境可以是分开的。对于开发环境必须具备编辑器、编辑器和阅读器,以及较为齐备的软、硬件环境。而对于超文本的运行环境只需要阅读器,所需的链接库和相应的趤文本文档,以及较为精简的软硬件环境。 超文本应用系统的设计超文本应用系统的设计与多媒体应用软件的一般开发步骤相似,类似一个电影剧本创作。每个结点就是一个“镜头”,只不过结点的联系不是顺序的单线索,而是多线索复合的复杂结构,所以超文本应用系统的设计文档——设计说明书,也称为脚本。超文本应用系统的编程相对较为简单,但是它的设计、构思更追求艺术性,需要更高审美力,所以一个超文本应用优劣,很大程度上取决于主题、创意、界面效果等因素。 超文本应用系统的脚本,至少应清晰地勾画出整个信息网络和详细地描述各个信息结点,为在计算机上实现应用系统的设计,提供具有可操作性的规格和流程说明。一般来说,脚本主要包含主题说明和线索说明。 (1)主题说明:在超文本系统中,从逻辑上讲,整个应用系统由一个个有具体含义的主题构成;从实际上看,通常一个主题就是一个结点。主题说明就是要明确指定结点的名称、具体的内容、使用的信息载体、结点的界面形式,并标该结点所涉及的链等。 (2)线索说明:主要是描述超文本的网络结构。根据链接的方式,采用多个线索描述链接的流程。一般可按以下几个线索进行描述: ①顺序链线过。在一个应用系统中通常有多个顺序链组,每个链组作为一个顺序线索。要指定顺序线索的名称和顺序组中结点的排列顺序。同时在主题描述中也包括每个结点所在的顺序组及它的排列顺序值。 ②点动触发链线索。对于结构链、交叉线索链等点动触发式链构成的较为复杂的线索,可行的办法是用有向图描述网状的信息流程。同时,在主题说明中对结点进行描述时,详细定义每个链的链源位置和链的各种属性。 ③关键字链线索。在超文本应用中,为了便于检索查询,定义了许多关键字。每个关键字可作为一个线索,按字典的方式排列所有的关键字,并描述每个关键字链接的所有结点。同时在主题说明中,也描述每个结点相关联的关键字。6.2 多媒体数据库一.传统数据库与多媒体带来的问题 1.传统的数据库系统 传统的数据库系统主要有三种类型:关系型、层次型和网络型。其中,关系型数据库因为有比较完整的理论基础,"表格"一类的概念也易于被用户理解,因而逐渐取代网状、层次模型,在数据库中居主导地位。关系模型把现实世界事物的特性抽象成数字或字符串表示的属性,每一种属性都有固定的取值范围。于是,每一个事物都有一个属性集和对应它的属性值集合。例如 公司用关系数据库管理雇员的资料。雇员的信息可以抽象为工号、姓名、年龄、性别、月工资、所在部门、该部门的经理等多项属性。对这样一个比较复杂结构的实体雇员,关系数据库需要把它分解成最简单实用的关系雇员(工号、姓名、年龄、性别、月工资、部门编号)和部门(部门编号、部门名称、部门经理)来表示。实体的结构语义隐性地包含在两个关系的相同属性(部门编号)中。只有通过联结、投影等操作才能体现出结构语义。关系数据库的这一特性非常简洁,既可以用数学理论加以规范和证明,又通俗易懂,易于被人们接受。2.多媒体带来的问题 随着多媒体开发技术的发展,各色各样的多媒体产品越来越丰富,传统模型就显得臃肿、低效,其局限性也就显露出来。多媒体对数据库设计的影响主要表现在以下几个方面: (a)数据量巨大且媒体之间量的差异也极大,从而影响数据库的组织和存贮方法。 (b)媒体种类的增多增加了数据处理的困难。 (c)媒体不仅改变了数据库的接口,而且也改变了数据库的操作形式,其中最重要的便是查询机制和查询方法。 (d)多媒体信息的分布对数据库体系结构带来了巨大的影响,主要是指以WWW全球网络为基础的分布。 (e)传统的事务一般都是短事务,在多媒体数据库管理系统中也应尽可能采用短事务。 (f)多媒体数据管理还要考虑版本控制的问题。二.多媒体数据的管理 多媒体数据就是表示文本、表格、声音、图形和图像等形式的数据。它们在多媒体数据库中的逻辑和物理特征与一般多媒体系统相同。所谓多媒体数据的管理就是对多媒体数据的存储、编辑、检索、演播等操作。目前对多媒体数据的管理主要有: 1.文件系统管理方式 2.扩充关系数据库的方式 3.面向对象数据库的方式1.文件系统管理方式 多媒体资料是以文件的形式在计算机上存储的,所以用各种操作系统的文件管理功能就可以实现存储管理。Windows的文件管理器或资源管理器不仅能实现文件的存储管理,而且还通过文件属性关联,双击鼠标左键就能实现有些图文资料的修改,演播一些影像数据。为了方便用户浏览多媒体数据,出现很多的图形、图像浏览工具软件。文件系统方式存储简单,当多媒体数据较少时,浏览查询还能接受,但演播的数据格式受到限制,最主要的是当多媒体数据的数量和种类相当多时,查询和演播就不方便了。所以,文件系统方式一般只适用于小的项目管理或较特殊的数据对象,所表示的对象及相互之间逻辑关系比较简单,如管理单一媒体信息,象图片、动画等。文件系统的树型目录的层次结构也能反映数据之间的部分逻辑关系,因此用文件系统管理多媒体数据前应根据具体情况建立合理的目录结构。2.扩充关系数据库的方式 用关系数据库存储多媒体资料的方法一般有3种:I. 用专用字段存放多媒体文件。大多数先进的关系数据库将大二进制对象(BLOB)作为新的数据类型,将其看作二进制和自由格式文件;II. 多媒体数据分段存放在不同字段中,播放时再重新构建;III. 文件系统与数据库相结合,多媒体数据以文件系统存放,即若关系中元组的某个属性是非格式化数据,则以存放非格式化数据的媒体类型、应用程序名、媒体属性、关键词等代替。这是比较简单的一种实现方式。3.面向对象数据库的方式 由于多媒体信息是非格式化的数据,多媒体数据具有对象复杂、存储分散和时空同步等特点,所以尽管关系数据库非常简单有效,但用其管理多媒体数据仍不太尽如人意。于是就有人提出了用面向对象数据库来管理多媒体数据。面向对象数据库是指对象的集合、对象的行为、状态和联系是以面向对象数据模型来定义的。 它具有的如下优点: I. 支持"聚合"与"概括"的概念,从而更好地处理多媒体数据等复杂对象的结构语义; II. 支持抽象数据类型和用户定义的方法,便于数据库系统支持定义新的数据类型和操作; III. 面向对象系统的数据抽象、功能抽象与消息传送的特点使对象在系统中是独立的,具有良好的封闭性。这就封闭了多媒体数据之间的类型及其他方面的巨大差异,并且很容易实现并行处理,也便于系统模式的扩充和修改; IV. 面向对象系统中实体独立于值存在,避免了在关系数据库中引入多媒体数据所导致的各种异常; V. 面向对象系统的查询语言通常沿着系统提供的内部固有联系进行,避免了大量查询优化工作。 但是由于面向对象概念在各个领域中尚未有一个统一的标准,面向对象模型并非完全适合于多媒体数据库,所以用面向对象数据库直接管理多媒体数据尚未达到实用水平。三.多媒体数据库管理系统基本功能与体系结构 多媒体数据库是计算机多媒体技术与数据库技术的结合,它是当前最有吸引力的一种技术。多媒体数据库技术正是研究并实现对多媒体数据的综合管理,即对多媒体对象的建模,对各种媒体数据的获取、存储、管理和查询。1.多媒体数据库管理系统具有的基本功能应包括: (1)多媒体数据库管理系统必须能表示和处理多种媒体数据; (2)多媒体数据库管理系统必须能反映和管理各种媒体数据的特性,或各种媒体数据之间的空间或时间的关联; (3)多媒体数据库管理系统除必须满足物理数据独立性和逻辑数据独立性外,还应满足媒体数据独立性; (4)多媒体数据库管理系统的某些操作与传统数据库的操作相同,但也要求许多新的操作功能。(1)多媒体数据库管理系统必须能表示和处理多种媒体数据;数据在计算机内的表示分格式化和非格式化两种。对常规的格式化数据使用常规的字段(field) 表示。对非格式化数据,像图形、图像、音频及视频信息数字化等,多媒体数据库管理系统要提供管理这些异构表示形式的技术和处理方法。(2)多媒体数据库管理系统必须能反映和管理各种媒体数据的特性,或各种媒体数据之间的空间或时间的关联;不同媒体数据之间存在的自然关联,包括时序关系(如多媒体对象在表达时必须保证时间上的同步特性)和空间结构(如必须把相关媒体的信息集成在一个合理布局的表达空间内的有关特性)。因此,在多媒体数据库管理系统中,除了要对多媒体数据的内容与结构建模之外,还要提供对各种媒体数据的特性和集成机制的时空关联的组织和管理方法。(3)多媒体数据库管理系统除必须满足物理数据独立性和逻辑数据独立性外,还应满足媒体数据独立性;所谓媒体数据独立性是指在多媒体数据库管理系统的设计和实现时,要求系统能保持各种媒体的独立性和透明性,即用户的操作可最大限度地忽视各种媒体的差别,而不受具体媒体的影响和约束;同时要求它不受媒体变换的影响,实现复杂数据的统一管理。由于多媒体数据种类繁多,形式多样,语义关联丰富,内部结构表示各异,故各种模式及映像比传统数据库复杂得多,涉及的数据量也大得多,要真正做到物理数据独立性、逻辑数据独立性和媒体数据独立性并非易事。(4)多媒体数据库管理系统的某些操作与传统数据库的操作相同,但也要求许多新的操作功能。a)提供比传统数据库管理系统更强的适合非格式化数据查询的搜索(search)功能允许对Image等非格式化数据做整体和部分搜索;允许通过范围、知识和其它描述符的确定值和模糊值搜索各种媒体数据;允许通过对非格式化数据的分析建立索引来搜索数据;允许通过举例查询(Query-by-Example)和通过主题描述查询使复杂查询简单化。b)提供浏览功能允许浏览数据库信息的目录结构;允许浏览某一具体题目和与此题目相关的信息;允许浏览数据库去寻找用户假设的信息支持。c)提供构造解(Construct solutions)功能使用一系列的应用约束和触发条件,解决要求访问大容量数据问题和数据库的一致性问题;提供演绎和推理功能;提供过程或函数。d)对非格式数据还应视不同多媒体提供不同的操纵图类数据:覆盖(overlay),邻接(aboutment),镶嵌(mosaic),交接 (overlap),比例(scale),剪裁(crop),颜色转换、定位等;声音数据:声音合成、声音信号的调度、声调和声音强度的增减调整等。e)多媒体数据库管理系统的网络功能多媒体数据库由于它的数据来源、应用、数据量等原因,往往被分布于网络的不同结点上,因此还应解决分布在网络上的多媒体数据库中数据的定义、存储、操纵问题,并对数据的一致性、安全性、并发性进行管理。f)多媒体数据库管理系统应具有开放功能提供多媒体数据库的应用程序接口API (Application Program Interface)。g)多媒体数据库管理系统还应提供事务(transaction)和版本(version)管理功能。2.多媒体数据库管理系统的体系结构 多媒体数据库管理系统的层次结构如图所示: 多媒体数据库管理系统的组织结构可分为三种: (1)集中型 (2)主从型 (3)协作型(1)集中型:集中型数据库管理系统是指由单独一个多媒体数据库管理系统来管理和建立不同媒体的数据库,并由这个MDBMS来管理对象空间及目的数据的集成。(2)主从型:每一个媒体数据库都有自己的管理系统,称为从数据库管理系统,它们各自管理自己的数据库。这些从数据库管理系统又受一个称为主数据库管理系统的控制和管理。用户在主数据库管理系统上使用多媒体数据库中的数据,是通过主数据库管理系统提供的功能来实现的,目的数据的集成也由主数据库管理系统管理。(3)协作型:数据库管理系统也是由多个数据库管理系统组成的,每个数据库管理系统之间没有主从之分,只要求系统中每个数据库管理系统能谐调地工作,但因每个成员MDBMS彼此有差异,所以在通信中必须首先解决这个问题。为此,对每一个成员MDBMS要附加一个外部处理软件模块,由它提供通信、检索和修改界面。在这种结构的系统中,用户可以位于任一数据库管理系统位置。6.3 基于内容检索所谓基于内容检索,就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据出来。 1.基于内容检索系统的体系结构。 插入子系统 – 该子系统负责将媒体输入到系统之中,同时根据需要为用户提供一种工具,以全自动或半自动(即需用户部分干预)的方式对媒体进行分割或节段化,标识出需要的对象或内容关键点,以便有针对性的对目标进行特征提取。 特征提取子系统 – 对用户或系统标明的媒体对象进行特征提取处理。在提取特征时,往往需要知识处理模块的辅助,由知识库提供有关的领域知识。2.基于内容检索的关键技术 (1)特征抽取 (2)相似索引结构(1)特征抽取 (I). 语言信号的特征提取和匹配 低层特征(原始特征) 高层特征(逻辑特征) (II). 静态图象的特征提取和匹配 低层特征:纹理特征,颜色特征, 几何形状特征,统计特征(立方图)等。 高层特征:人的脸部特征、表情特征、某些物体和景物特征。 低层特征可用图象处理方法自动获取;高层特征可以在某些约束条件下或 知识导引下,以低层特征为基础推导得到。 (III). 动态视频特征提取 低层特征:镜头切换类型、特技效果、摄象机运动、物体运动轨迹、代表帧、全景图。 高层特征:描述镜头中的内容或事件。(2)相似索引结构 一维:折半查找。 多维:特征空间分布,数据集切分为子数据集,对每个子数据集建 立描述,检索通过子数据集描述比较。去掉不符和条件的子数据集,仅对合格者进行检索和计算,大大减少检索量。3.基于内容检索系统的设计与实现在多媒体数据库中,查询处理的难点在于如何基于非格式化数据的内容进行查询,即内容搜索问题。在多媒体数据库中,图像、声音、视频等数据以经过数字化得到的位串的形式存储,对这些多媒体数据的内容搜索的方法如下: (1)模式识别法 (2)特征描述法(1)模式识别法模式识别是指利用计算机或其他装置对物体、图像、图形、语音、字形等信息进行自动识别。用户在查询请求中给定图像、声音或视频影像数据,系统用模式识别技术,把该媒体对象与多媒体数据库中存储的同类媒体对象进行逐个匹配。但是模式识别法在当前的技术条件下,还不是很实用。因为,一些昂贵的的模式识别软件只能对某些特定的应用有效;用户难以精确的指定所需要的图像、声音、视频等媒体数据;模式识别算法的执行十分耗时。(2)特征描述法这种方法的基本思想是给每个媒体对象附上一个特征数据,用这种特征数据描述来表达媒体数据内容。这种方法的关键问题是如何获取这种特征描述数据。根据获取方式和特征描述数据的形式,这类方法又分为: (I).自然语言描述法:用自然语言来描述媒体数据的特征。多媒体数据库系统采用这种方法支持图像和声音的内容搜索。该系统允许将文本自然语言描述附加到多媒体实例上,进而捕捉它们的内容。这种方法对于用户十分方便,因为这种描述易于输出,易于理解。查询请求以文本短语的形式输入,由系统将其转化为基于一阶谓词逻辑推断的定理证明机制来完成; (II).图像解释法:图像的内容用它包含的对象来描述,每个对象由图像分析处理程序导出。从图像中识别出来的全部对象解释,系统将其与图像数据一起存储在多媒体数据库中,同时针对每个图像解释中的结果建立图像索引,供系统处理图像内容查询时采用。尽管图像解释的获取比较费时,但是图像解释的获取是一次性的。因此,此方法可行; (III).特征矢量法:基本思想是用图像压缩技术对图像进行压缩并矢量化。把图像分解成碎片对象、几何对象和开口曲线的集合,存储起来,并把它们作为索引矢量,建立索引,系统就可以进行图像内容搜索。分解处理虽比较费时,但对每个图像只需执行一次;另一方面,图像生成过程更快。因此,此方法可行。 展开更多...... 收起↑ 资源预览