论文部分内容阅读
在企业的信息化建设过程中,各个部门根据各自的信息要求和特定的应用开发了基于不同数据源的应用系统。如何将这些应用系统的数据进行集成,在企业中实现数据集成和共享,给企业用户提供企业数据的统一视图,从而根据集成之后的数据及时调整业务策略,对企业有着十分重要的意义。 本文研究基于XML的数据集成及其应用。它从数据集成的任务和需要解决的关键问题出发,提出了一种基于XML的数据集成体系结构。该体系结构结合了其它基于XML的数据集成研究项目的优点,采用XML Schema和XQuery作为异构数据源的公共数据模型和全局查询语言,利用消息中间件实现全局代理与局部代理之间的通信,支持关系数据源、XML数据源以及CSV文件数据源的集成。 本文首先提出了关系数据源、XML数据源以及CSV文件数据源的XML Schema创建和集成方法。其次,提出了XQuery查询的校验算法、标准化规则、分解算法以及XML中间结果的组合方法,并用实验对分解算法的完整性、正确性、适用性进行了验证。再次,提出了关系代理、XML代理的查询处理框架,介绍了查询处理框架中功能组件的实现。最后,介绍了基于XML的数据集成系统所用关键技术在中南大学信息港项目中的实现。 本文的创新之处在于提出了一种基于XML的数据集成体系结构,提出了关系数据源、XML数据源以及CSV文件数据源的XMLSchema创建和集成方法,提出了一个易于实现的XQuery查询分解算法,提出了一种关系代理和XML代理的查询处理框架。