XML数据查询的关键技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ruocich
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML的全称是Extensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式,并逐渐成为当前网络应用中事实的数据表达、交换的标准。鉴于XML在诸多领域有广泛的应用前景,许多关于XML的研究都是前沿和热点课题。例如在数据库领域,从某种意义上说XML作为数据库使用可以自然地表示嵌套型数据,比关系型数据库具有更强的表达能力,但是对XML数据的查询还有很多不完善的地方,其查询准确性与查询速度都需进一步的提高。XML数据管理系统主要解决XML数据的存储管理、查询处理、访问控制、数据更新等。XML查询处理与优化包括XML查询代数、查询处理、查询优化等。XML数据查询是XML数据管理一个非常重要的组成部分,是当前学术界研究的一个热点方向。XML查询根据其查询模式的不同可以分为两类:XML Query查询方式和XML IR查询方式。而XML IR方式又可以细分为三类:XML IR/keyword方式、XML IR/query方式和XML IR/fragment方式。本文主要研究XML数据集成查询过程中碰到的一些问题,以及所采取的相应解决方案。其中主要包括三部分的内容:第一,由于XPath是当前流行的XML数据查询语言XQuery和XSLT的基础,我们针对XPath语言中的复杂路径表达式,设计了一种路径表达式的最优化方法,用以提高在对XML进行查询时的执行效率;第二,基于当前比较流行的一种查询代数OrientXA,基于代数表达等价原则,设计了一系列的等价转化方法,简化了XML查询路径表达式的代数表示,优化了XML数据的查询效率;第三,针对多XML数据源的集成查询,由于查询过程往往涉及到对多个XML片段中相似重复信息的处理,而我们有时候需要对多XML片段中的共同信息进行提取,由此,本文提出一种XML有向标记树模型,并在此模型上设计了一种相似匹配算法来对共同信息进行挖掘。实验显示,该算法具有很高的可行性及使用价值。
其他文献
目前,温度监控系统在很多工业行业起着相当重要的作用,各种各样的监控系统也层出不穷,温度监控系统也提供了越来越丰富的通讯服务功能。这些系统也是随着硬件卖给用户的。随
迁移工作流是近年来工作流管理研究的一个新方向,该方法基于移动计算范型构建了一个全新的工作流系统框架,该框架由迁移工作流引擎、工作位置和迁移实例三要素构成。迁移工作
面对海量的互联网信息,传统搜索引擎在查找主题信息方面日益无法满足人们的要求,如何帮助人们及时准确地获取主题信息变得越来越重要,而面向主题搜索引擎技术正是为此应运而生的
随着经济的高速发展,良好的企业内部管理是企业竞争力强弱的重要因素之一。因此,对企业各部门工作进行评价已经成为企业的重要工作。论文将BP神经网络技术应用于企业评价预测,在
随着计算机技术和人工智能技术的发展,组卷问题的研究受到越来越广泛的关注。智能组卷问题是一个在一定约束条件下的多目标参数优化问题,组卷的效率和质量完全取决于试题库以
随着全球电视数字化时代的到来,我国现在正在大力推进数字电视的普及和应用。数字电视的交互性赋予了它许多功能,电子节目指南(EPG)是数字电视的基本业务之一,它是实现用户友
随着嵌入式软件的广泛应用,嵌入式软件的结构和开发技术日新月异,相对于硬件的日益稳定,软件故障却经常出现。为了保证软件的质量,需要对软件进行测试。由于嵌入式软件的自身
云计算作为一种新型的计算模式为计算、存储提供了一种新的解决方式。外包计算模型随着云计算的发展而因运而生,一个计算能力较弱的用户将复杂的计算外包到云服务器,云服务器
随着Internet的发展,越来越多的单点到多点的数据传输应用应运而生。组播比传统的单播和广播协议更适合这种一对多的数据传输。传统的组播虽然具有网络利用率高、能节省发送
车间作业调度是典型的NP难题。由于车间作业调度问题在组合优化方面的复杂性,直接影响着生产效率的提高和获取利润的大小,因此,车间作业调度的研究和应用,对于企业提高管理水