采用流水线方式的XML整体小枝查询算法的研究

来源 :北京工业大学 | 被引量 : 4次 | 上传用户:zy205806
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,XML已经在互联网环境中扮演着越来越重要的角色,逐渐成为各种各样数据的存储、交换和表示标准。为了满足查询和处理XML数据的需求,W3C发布了XQuery语言正式推荐标准,作为针对XML数据的查询与处理规范。XQuery语言是一种功能强大的XML查询与处理语言,其地位类似于关系数据库中的SQL语言,适用于来自不同XML数据源的信息,能够从XML中提取出所需数据,进而重构为指定的结构。在XQuery语言表示的查询中,针对XML数据结构特征进行查询是实际应用中最基本和最常见的操作,也是时空开销最大的操作之一,其查询性能对XQuery程序的执行效率有着重要影响。这些结构查询可以提取成为小枝模式(Twig Pattern),而后采用小枝查询(Twig Query)技术,通过匹配算法获取XML数据中全部满足模式结构的XML数据。随着XML应用的不断扩展和深入,相应的XQuery程序愈加复杂,XML数据规模愈加庞大。因此,XQuery程序的执行效率变得日益重要,如何通过优化手段提高查询与处理效率具有很重大的研究意义。近年来,为了提高小枝查询的效率,研究人员提出了多种方案,然而这些方案中有些没有考虑如何利用多核计算资源,有些则需要预先掌握XML数据整体拓扑结构。为了高效实现XML整体小枝查询,本课题提出了新的TwigPipe算法。TwigPipe算法基于流水线方式,采用了新的数据划分算法和查询算法,结合了更为简单的数据中间表示形式以及新的预先枚举机制,能够仅仅通过一遍扫描完成查询操作。另一方面,根据XML数据特点,本文提出了多种优化方法,用来支持针对不同数据的复杂查询,实验结果表明,TwigPipe算法有效提高了查询效率和降低内存需求。
其他文献
无线传感器网络被广泛应用在军事和民事各个领域,随着应用范围的不断扩大,包含移动节点的应用逐渐增多,成为了无线通信领域的热点问题。传感器节点采用电池供电,且不易更换,
近年来出现一类具有链路长延迟、端到端路径频繁中断、能量缺乏供给、存储能力有限等特点的网络,该类网络无法直接应用现有Internet体系结构和协议。针对这些特点,研究人员提
符号计算是数学、计算机和人工智能相结合的一门交叉学科。随着计算机硬件性能的提高和软件功能的增强,人们通过计算机程序化地处理一些数学推理和代数计算问题逐渐成为可能。
随着互联网与信息技术的发展,电子商务的运营模式逐渐被人们所接受,但是传统的电子商务模式因其系统功能单一、交易成本高、自动化程度低等原因不能适应用户们的需求,因此人
大气电学是研究电离层以下的大气中所发生的各种电学现象及其生成和相互作用的物理过程的学科,是大气物理学的一个重要分支。大气电学的研究是当前世界各航天大国所面临的共
数字家庭是当前世界各国正在努力探索的新型产业,发达国家已经在基础通信、智能家居和养老服务等方面取得显著进展。中国数字家庭虽处于起步阶段,但发展速度非常快。现阶段数