数据集成平台中XML查询引擎的实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:xcnyy_007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业的发展,信息化建设中面临着异构数据源数据集成的需求,XML作为一种结构化语言,能对各种数据源的信息内容进行标记,包括结构化和半结构化文档、关系数据库和对象库。本文以XML作为数据交换的标准格式,研究数据集成平台的相关技术。基于Eclipse平台,以开发基于XML数据集成框架为目标,设计实现了一个XML查询语言(即XQuery)引擎。参考XQuery规范,完成了XML文档解析,XQuery语法解析,语法树执行等功能模块的划分,并定义各部分的交互接口。设计了两种客户端调用方法:命令行和XQJ API,前者可以设置引擎执行的必要参数,后者采用类似于JDBC的方式调用引擎,使之支持预编译、参数查询等功能。使用SAX方式解析XML文档,使用带有类型信息的SAX事件流创建数据模型。针对最常见的影响性能的问题采取适当的优化策略,对XQuery语句解析树的进行优化,提高查询效率。结合具体的实例说明了数据集成框架的功能。综上所述,本文从数据集成框架设计,以及底层XQuery引擎设计展开了一系列工作,最终实现了一个高效率、扩展性强的XQuery查询引擎,并对集成框架的进一步改进,以及提高XQuery引擎的效率做出了探讨,这些研究验证了以XML为交换格式的数据集成方案的优势,为异构系统集成提供了有力工具。
其他文献
随着存储容量和CPU的处理能力的快速增长,磁盘带宽能力却没有得到相应的提升,I/O已经成为影响计算机性能的瓶颈。并行文件系统和并行I/O成为解决磁盘数据处理能力和CPU计算能
目前网络上分布着海量的空间地理信息,这些信息以诸多的格式存储,由不同的个人和单位维护。信息之间的互操作性已成为近年来业内关注的热点问题。然而,传统的方法比如数据格
随着互联网的快速发展,网络上汇集了包括网络新闻在内的大量的信息。网络新闻已成为当今社会重要的信息载体和人们获取信息的重要渠道。由于网络新闻内容丰富多样,情感倾向也
自然语言处理是计算机科学领域中的一个重要研究方向,是人工智能的一个重要分支。汉语自动分词是中文信息处理的重要基石。困扰汉语自动分词发展的原因有很多,对歧义字段的排
在视频通信中,视频编码和视频传输是两个重要的组成部分。本文研究的重点是在视频压缩技术,目的是利用基于ROI(Region Of Interest)视频编码技术来解决网络容量和视频通信质量
随着油田开发进入中后期,油井采出液含水率越来越高,产出水的处理问题越来越严重,突出表现在:经济上,产出水的举升、存储和处理费用,水处理设备投入和操作费用等不断增加;环境方面,产
教学质量测评是高校的一项常规工作,开展这项工作经历了人工处理与计算机处理两个不同阶段。利用人工开展这项工作存在工作周期长、工作量大、统计信息准确率低等一系列问题,
随着Internet在全球范围的迅速普及和应用,Web信息量正以惊人的速度增长。如何快速、有效地发现有用的信息资源已成为急待解决的问题。Web挖掘作为一种以从Web的海量信息中挖
虚拟训练仿真是指基于虚拟现实技术的训练仿真,是实际训练过程在计算机上的映射。随着虚拟现实技术的日趋成熟,将虚拟人“嵌入”虚拟训练仿真的环境中去,作为受训人员在虚拟
随着Internet的发展,计算机网络安全成为越来越受人们关注的问题。为了增强计算机网络的安全性能,人们采用了多种安全技术,包括加密、身份认证、访问控制等,随着入侵检测技术