基于关系存储的XQuery核心语句查询计划生成与优化研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:gaoaiping0322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML在各行各业的广泛应用产生了海量的XML数据,目前工业界和学术界基本上都采用XML数据库的方式来对其进行管理。而为了保障XML数据库的查询性能,对XML查询的优化就显得格外重要。   论文基于南开大学自主研制的无缝集成关系型数据库PostgreSQL的纯XML管理引擎DiReX,重点研究了XML的标准查询语言XQuery的核心语句(FLWOR语句和XPath语句)的查询计划生成以及优化问题。   针对FLWOR查询,本文在借鉴成熟的关系代数以及目前主流的XQuery查询代数的基础上,提出了一个新的XQuery查询代数——DiReXA。在DiReXA中,重点定义了XQuery查询的若干操作符,并且对其中的FLWOR查询的关键变量进行了划分。在DiReXA查询代数的指导下,本文实现了FLWOR语句的查询计划生成。同时,在查询计划的生成过程中融入了对FLWOR查询的两个局部优化——where子句的谓词还原优化以及首变量的路径还原优化。   针对XPath路径表达式查询,本文充分利用底层存储提供的多种索引结构(标签索引、属性索引以及结构摘要索引),提出了XPath精简查询树的概念。通过对XPath原始查询树进行片段的合并与分裂,重写为一棵简化了的并且能够充分利用上述索引结构进行结点快速定位的精简查询树,在加快XPath查询片段结点定位速度的同时,减少了结构连接的次数,从而达到提高XPath路径表达式查询性能的目的。   最后,本文设计相关实验,在不同规模的XML测试数据集上验证FLWOR查询优化(where子句的谓词还原优化和首变量的路径还原优化)以及XPath精简查询树重写优化的有效性。实验结果显示,上述优化是切实有效的。
其他文献
近年来,在不确定数据库上进行信息查询已经成为了一个热点问题,其中如何结合关键字查询以及查询结果排序成为了重要的研究内容。不确定数据在运用的过程中常常会涉及到信息检索
随着信息技术的不断发展,特别是互联网的不断发展,网络中每天都会产生大量的信息,面对这些海量信息,如何选取符合自己实际需要,符合自己能力水平,符合自己阅读习惯的信息,是网络时代
伴随着当代科学技术的高速发展,设备具有越来越高的集成度,也变的越来越复杂,作为承载各种信息的网络已成为人们生活中不可或缺的一部分。但是,网络在日常的运行中会不经意的
随着新兴数据业务的迅速发展和带宽的不断增长、无线业务的IP化演进、商业客户的VPN业务应用,对承载网的带宽、调度、灵活性、成本和质量等综合要求越来越高。而且网络技术演
煤矿主排水系统是影响煤矿安全生产的重要因素之一,其作用是将矿井涌水排放至地表,防止地下水淹没矿井造成人员、设备损失,保障矿井正常生产。  采矿计算机辅助设计在工程中的
无线传感器网络是由许多随机分布的传感器节点以自组织的方式形成的一种无线网络。节点间通过相互合作以完成用户发布的感知任务。最早可以追溯到上个世纪70年代,最开始主要
随着个人计算机的普及以及计算机图形软硬件技术的飞速发展,使用计算机观看电影、进行游戏已经成为人们重要的娱乐方式之一,而人们对视觉效果的要求也越来越高。因此,计算机图形
科学的发展为人类的生活提供了诸多便利,智能化被广泛应用在各个领域,人们的生活越来越丰富,旅游业也随机成为热门行业,景区游客人数大增,为了给游客提供更多便利,越来越多的自然景
校园信息化是校园发展历史上最为深刻的变革之一,推进优质资源的共建、共享、运作和应用是实现校园信息化的重要内容,是建设一流校园的必要条件之一。近年来,随着REST技术和开放
曲面造型作为CAD/CAM的核心技术,是航空、汽车、船舶、影视等领域中设计人员重要的设计工具。其中,灵活精确、自然高效的曲面变形技术一直是曲面造型中的研究热点。已有的曲面