论文部分内容阅读
随着网络技术的迅猛发展,开放式网络中的海量信息资源的规模和复杂度以指数级别增长,这对海量信息资源的智能化管理提出了更高的要求,需要解决信息资源的表示、信息资源的存储和基于本体的语义查询等关键技术,尤其需要面向数据库的语义查询技术。本论文通过对开放式网络环境下产生的海量信息资源管理进行深入的系统研究,详细的探讨了实现面向数据库的语义查询的关键技术,本论文的研究内容和主要贡献如下:1.建立面向数据库的语义查询模型根据在海量信息资源上的语义查询特点,建立了面向数据库的语义查询模型,并将模型分为三个关键部分。第一部分是本体相关部分,该部分是实现语义查询的基础和依据,包括本体的建立、本体的存储等。第二部分是信息资源的表示和存储部分,该部分主要功能是如何表示和存储海量信息资源,包括信息资源的表示,信息资源的语义标注和信息资源的存储。第三部分是语义查询部分,该部分是语义查询的实现部分,主要和RDBMS的中心服务器有关,是中心服务器为支持基于本体的语义查询所需要进行的适应性调整,这部分也是论文的工作重点部分。2.建立概念相似性度量模型本体概念的语义相似性度量是实现基于本体的语义查询的理论依据,论文中辨析了相似性和相关性概念的含义,以心理学领域概念相似性度量模型为基础,结合人工智能领域概念相似性度量模型,建立概念相似性度量模型,为实现基于本体的语义查询提供理论基础。3.将概念相似性度量模型引入RDBMS体系结构结合RDBMS处理查询的过程,将本体概念的语义相似性度量模型作为一个推理模块,纳入到RDBMS的体系结构中,为其它模块提供接口。用于存储本体、计算概念相似性,为RDBMS实现基于本体的语义查询提供推理接口。4.RDBMS中心服务器体系结构适应性调整根据OSCAR数据库中心服务器体系结构特点,深入分析了中心服务器提供语义查询支持时所需要的适应性调整,提出了支持语义查询的OSCAR中心服务器新的体系结构简化模型,分析了体系结构中每个模块在支持语义查询中所做的适应性调整。5.提出基于节点关系的结构连接索引根据被序列化为XML数据的映射存储策略的特点,为提高查询效率,提出一种新B+树索引管理模式。在XML数据映射到表中之后,数据中的节点间的关系不再和以XML数据形式存在的方式那样直接,有必要以某种形式来保存这些关系。在节点关系的结构连接索引算法中,将XML数据视作一颗树,树中的节点表示数据中的元素,树中的边表示数据中的元素关系,算法中建立了节点信息索引和节点关系索引,其中节点关系索引的索引项包括文档ID,节点ID,父节点ID、右兄弟节点ID,最左孩子节点ID,根据这些索引项,可以轻松的推导出任意节点之间的祖先/后代关系,从而快速的获取基于结构查询的结果。