基于XML模式的异构数据集成中间件研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wjz5201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着计算机技术、网络技术、信息技术的高速发展以及电子产品成本的急速下降,企业的信息化得以空前的施展,信息化使得企业在发展过程中积累了不少数据。市场环境变化的复杂性以及企业发展竞争的激烈性,使得企业需要访问多种数据源的数据,以提高自身的竞争实力。由于多种原因,这些数据源之间存在异构特点,如何有效地解决这种差异性,为企业访问异构数据源提供便利,则是企业高度信息化亟待解决的问题。典型的解决方案是借助于数据库服务器,将各数据源中的数据提取出来,经过数据转换存储到中心数据库,操作中心数据库的数据,但这样会导致大量的数据重复存储,同时也影响业务的敏捷性。还有一种方案是运用数据库服务器和虚拟视图方式来到达数据集成的目的,这种方案的不足之处在于对XML数据或者非结构化数据的处理效果不佳。如何提供一个高效的、可扩展的、可靠的异构数据集成中间件,使其能够提供统一的接口为其它应用系统的开发服务,则是当前数据集成研究的热点。本文分析了当前异构数据集成领域中的主要问题,针对数据源存储结构的特点,提出数据源分类的思想,把数据源分成数据库、XML、非结构化三种类型,依据各自的特征,对每一类数据源采用统一的方式处理。对于数据库数据源,利用数据库服务器来处理;对于XML数据源,则应用XQuery引擎处理;对于非结构化数据源,转化成XML数据源来处理。利用XML模式描述数据的优点,通过提取各数据源的元数据,对元数据进行转换处理,在此基础上根据一定的规则构建虚拟数据库,使得待集成的数据源以一致的全局视图形态呈现给用户。借鉴JDBC能够访问不同数据库的设计特点,针对开发人员设计异构数据集成中间件HDAM(Heterogeneous Data Source Access Middleware),描述了中间件各功能模块的作用和运行流程,说明了HDAM的数据源注册接口和数据操作接口,研究了全局查询分解以及局部查询语句的转换算法。最后经过开发和测试验证了中间件设计方案的可行性和正确性,并通过案例演示了HDAM的应用流程。本课题基于对数据源分类的思想研究异构数据集成,提出在中间件设计中利用XQuery处理器处理XML数据,提高了中间件处理XML数据和非结构化数据的查询效率,从而使得集成中间件扩展性更好,访问速率更快。
其他文献
随着信息科技的快速发展,很多应用领域产生了大量的现实数据。如网络安全、股票分析、电子商务、气象监控等领域。在这些数据中可能隐含着丰富的、有价值的、亟待挖掘的信息,
Web2.0的迅速普及带给人们丰富信息的同时,也使人们对信息的把握能力大大下降,庞大的信息量已经超出了人们预期的设想。传统的信息检索系统已经不能满足用户需求,通用搜索引
P2P视频点播是目前网络应用研究的热点,而数据请求任务调度是P2P视频点播系统设计时需要考虑的关键问题。绝大多数现有的数据调度策略都是从请求节点端出发来进行设计。在这
在我国信息社会高速发展的今天,传统的选举计票方式已经远远不能够满足社会的需求。以往的计票方式,如基于人工唱票的方式、基于电子选举方式和基于机器识别和智能票箱的方式
随着经济的发展,智能交通系统(Intelligent Transportation System,ITS)已成为解决现代道路交通问题的一个重要手段。车载导航系统是ITS的重要组成部分。车载导航系统是由计
随着网络和多媒体技术的不断发展,网络可视电话(VoIP)技术已经在Internet中得到广泛的应用。如何设计一款软硬件简单、稳定性好、音画质高以及价格适中的VoIP终端将具有很好
WSN中传感器节点能量、存储处理和传输能力的限制使得传统的路由协议不适合无线传感器网络,同时与平面路由协议相比,分簇路由协议具有更好的健壮性和可扩展性,适用于大规模WS
工作流模型可以清晰的描述业务流程,而且随着信息技术的进步,其应用范围也越来越广,对工作流模型的科学评价也越来越成为必要。然而,传统工作流管理系统通常只是严格按照工作
时间序列是指将某种现象某一个统计指标在不同时间上的数值按时间先后顺序形成的序列。由于真实系统或现象的内部通常会受到多种因素的影响,从而导致输出的时间序列具有许多
随着互联网的盛行,主流的在线社交媒体取得了突飞猛进的发展,而微博在这些在线社交媒体中表现出了更加突出的发展态势。微博已经吸引了海量的用户,人们在微博上分享自己的观