论文部分内容阅读
随着计算机的应用越来越广泛,各个行业,各个部门都使用了相应的应用软件对部门内部的业务,信息等进行管理。随着互联网的发展,各地区,各部门之间,又要求能够实现网络互联互通,从而达到信息的交流和共享。但各个部门、各个地区之间,由于相同的数据由不同的用户以不同的方式建模,导致了不同程度上的异构,包括语义层的异构,使得相互联系的部门之间不能交换信息。信息集成(Information Integration)技术就是为实现各个数据源之间信息的交流和共享而发展起来的。信息集成就是要从分布的数据源中获取数据,建立多数据源的统一视图,并为用户提供有效的查询方式,最终实现信息共享。 传统的信息集成多集中在异构的信息格式和信息类型方面的集成,并且信息源相对固定。随着信息源分布的越来越广泛,信息源的增长和变化以及各个信息源的分布自治性,加上各个信息源之间缺乏一个统一的语义集,所以各个数据源之间语义方面的异构问题就突出显示出来。为了解决信息源之间语义层的异构,本文提出了一种面向语义的信息集成——基于本体的异构数据源集成系统模型OBISUA(Ontology-Based Integration System Universal Architecture)。该方法将本体(ontology)引入到信息集成系统中,这样就为异构的多个信息源提供了一个统一的语义集,通过支持语义层上的查询,可以实现分布的多信息源之间信息的共享和互操作。 为实现兼容性,规范性和可扩展性,本文采用web service框架,使用一组web service协议,来创建基于本体的异构数据源集成系统模型OBISUA,并描述了进行语义集成所必需的统一的语义集——本体以及利用本体进行语义集成的过程。在此框架下,本文重点分析了基于本体的异构数据源集成系统模型中的数据层包装器(Wrapper)的等价性证明和转换算法。本文在图的基础上,分别证明了从本体查询语言RDQL到关系数据库语言SQL的子集,RDQL到XML数据源查询语言XQUERY的子集以及RDQL到基于框架表示的知识库语言OKBC的子集的表达的等价性,并在证明等价性的同时找到了语言间的表达式层次上的对应关系,也就是找到了从RDQL到这些语言的转换方法。