论文部分内容阅读
随着科技技术的快速发展,越来越多的领域采用信息技术进行相应的操作和数据管理。此方式与以往的数据处理相比,简化了操作,提高了工作效率,但是随着信息化的不断推进,数据的存放日益分散且形式多样化,导致“信息孤岛”现象出现,严重地阻碍了信息化建设的整体进程。为了加快信息化建设步伐,实现最大程度的数据共享,迫切需要加大对异构数据集成的研究力度。分析当前的异构数据集成可以发现,如何更好地解决异构性和语义冲突至关重要。本文首先简要介绍了目前异构数据集成的相关技术背景,包括异构数据集成的研究现状、数据集成面临的问题、XML、XQuery、本体和WEB SERVICE的相关概念及应用。为了更好的解决异构数据集成中的异构性和语义冲突采用基于本体的方法来进行数据集成。在该方法中,利用混合本体构建模式通过映射建立彼此间的对应关系,实现异构数据的共享。本文的内容主要包括:(1)基于本体的异构数据集成技术研究。由于本体可作为概念模型的明确规范说明,因此采用全局本体和局部本体的混合本体模式,并分别对其进行构建。针对查询处理,引入基于语义缓存的查询优化,提高查询的效率,并对处理过程中的查询生成、查询分解和查询执行进行研究,最后描述了封装器的发布。(2)基于本体的映射研究。针对目前语义相似度的计算方法只考虑局部信息,导致分析结果不全面的情况,引入了基于多语义相似度的本体映射方法。该方法利用了概念实例相似度和概念定义相似度计算方法,通过选取合适的分量权值形成多语义相似度计算方法,最后根据此方法来发现本体间的映射关系。实验表明,多语义相似度方法与之前的方法相比更加全面地放映了本体间的语义关系,从而更好地为本体映射服务。(3)系统的设计及关键模块实现。在对目前已有的异构数据集成架构进行分析之后选择中间件模式集成,在此基础之上给出了基于本体的异构数据集成系统架构设计,利用JAVA的和Jena2框架和Protege本体开发工具对关键模块进行了实现。