论文部分内容阅读
随着计算机应用技术和电子商务的快速发展,企业可获取的信息数量和类型有了极大的增长。在企业应用和Web数据集成的需求的推动下,Web环境下的数据集成系统的研究己成蓬勃发展的趋势。由于XML的可扩展性、结构性以及平台无关性的优点,XML已经成为Internet数据交换事实上的标准。基于XML的数据集成不仅成为目前研究的热点,也成为数据集成的一个理想的解决方案。
本文研究了基于 XML 的半结构化数据集成问题。首先介绍了XML及其相关技术、半结构化数据的相关知识和半结构化数据中的约束关系;其次综述了如今数据集成研究领域的主要问题,包括集成系统理论框架、基本映射方案、查询重写算法等。在此基础上,设计了一个基于XML的数据集成系统框架。此系统框架用统一的XML视图来集成和查询异构数据源。由于充分利用了.XML数据模型的优点,该系统具有较好的可扩展性。最后,在原算法的重写思想基础上,提出了一种基于约束的改进的重写算法。通过引入映射规则中的约束条件,消除阻碍重写的Skolem函数,从而解决内定谓词问题,增大原算法的应用范围。证明了改进算法的正确性。性能分析和测试结果都表明,改进算法并不增加实质性的性能代价。