一种基于流的XML查询算法的设计与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：tianxiang521

【摘要】

：

XML在信息管理、电子商务、个性化出版、移动通信、网络教育、电子文档交换等诸多领域得到了广泛应用，已经开始成为Internet上数据描述和交换的事实上的标准。随着XML技术的不

【作者】

：

徐哲

【机构】

：

大连理工大学

【出处】

：

大连理工大学

【发表日期】

：

2004年期

【关键词】

：

XML流 XPath 自动机查询

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML在信息管理、电子商务、个性化出版、移动通信、网络教育、电子文档交换等诸多领域得到了广泛应用，已经开始成为Internet上数据描述和交换的事实上的标准。随着XML技术的不断发展及其应用领域的不断扩展，越来越多的数据开始采用XML进行描述、存储、交换和表现。传统的信息管理技术由于XML文档的出现而正面临新的挑战，因此增强面向XML文档信息查询能力变得越来越重要。通过对现有的XML文档查询算法分析发现：算法的实现都是把被查询文档全部载入内存之后再进行处理，因此要消耗大量内存，尤其是在XML文档很大以致于无法全部载入内存的情况下，现有的算法就无能为力了。针对这一问题，本文设计并实现了一种新的查询算法。该算法根据XPath查询表达式，生成一个查询自动机；将查询条件隐含在查询自动机的结构和状态中；XML流经过解析转化为事件流，这些事件作为查询自动机的输入，触发状态转换。查询自动机依据不同的输入事件，例如元素开始事件、文本事件和元素结束事件等，在各个状态之间进行转换。文档尽可能少地占用内存，一旦确认某一部分文档完全匹配查询表达式，就输出查询结果。论文中详细地介绍了由查询表达式构造查询自动机的步骤；实现了一个基于流的XML文档查询系统的原型，它可以在对XML流的一次单向读取过程中处理XPath，输出查询结果。论文中还对基于内存的XML查询算法和基于流的XML查询算法进行测试、比较，并对结果进行了分析。基于流的XML查询算法是为了满足一些数据密集型应用对数据查询处理的需求而引入的，这类应用处理的数据不宜用持久稳定的关系建模，而应采用数据流建模。这类应用的领域包括金融服务，网络监控，电信数据管理，生产制造，传感检测等。本论文的研究对这类实际应用将具有一定的理论意义和使用价值。

其他文献

SeiComGIS的研究和实现及其在土地系统中的应用

土地管理信息系统衍生于地理信息系统，是利用地理信息、遥感、数据库、网络等高新技术进行土地业务管理的系统工程，它是由土地相关信息、土地的权属关系、自然属性和经济属性组

学位

组件式地理信息系统数字国土组件技术空间数据管理空间查询

基于兴趣度的离群点挖掘技术研究

现代企业在其信息化的过程中积累了越来越多的数据,对于一些企业应用,异常数据的挖掘比常规模式的挖掘更有应用价值。对于这类数据挖掘研究的需求日益明显增加,无论在国内还

学位

离群点兴趣度新奇度局部偏离因素单元网格多库

基于嵌入式组件技术的网络通信的研究

随着嵌入式的广泛应用和深入发展，围绕着嵌入式性能改善的研究层出不穷。其中从软件系统的角度，结合当今流行的软件技术—组件技术对嵌入式系统中的软件组织结构进行全面改良，即

学位

嵌入式中间件协议族组件设计模式

基于电子公文的电子资料交换研究与实现

电子政务建设强调统一标准，互连互通。由于公文处理在政府办公事务中的重要地位，电子公文交换就成了政府互连互通的最重要的应用。早期的电子资料交换作业在考虑到资料的安全性

学位

电子资料交换XMLDOMDTDMVC

企业级应用平台的设计与实现

软件对现代企业的正常运作起着越来越关键的作用,开发这些软件需要训练有素的程序员从事艰难繁琐的工作。提高软件生产力已经成为软件研发公司追求的主要目标之一。当今时代,

学位

企业级应用开发平台模型驱动业务建模工作流

基于DSPs的MPEG-4编码器的改进和移植

数字视频处理在很多领域都发挥着重要的作用,而旧的视频标准已经不能满足日益增长的市场需求,所以应该开发基于新的视频标准的监控产品.本文首先介绍了视频处理的一般原理,主

学位

数字视频处理MPEG-4DSPs算法改进

网络自适应的基于复制的连续系统一致性控制方案研究与实现

随着计算机网络的不断发展，分布式的应用程序体系结构日趋成为主流。使用复制的方式构建分布式系统，由于能够有效得提高系统的响应性、降低网络信息传输量，在实践中得到广泛的应

学位

一致性控制网络自适应基于复制的连续系统本地滞后

基于数据挖掘的图形设计系统二次开发技术的开发与实现

计算机图形辅助设计系统的效率在很大程度上依赖于图形块的提取与设计,图形数据库所能提供的基于工程领域内的基本图块的类型和数量是图形设计系统二次开发的关键.在CAD技术

学位

图形相似相似度结构模式识别拓扑特征尺寸约束数据挖掘

一种基于流的XML查询算法的设计与实现

其他学术论文