基于双拟关系的XML结构摘要索引技术的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zwfyazl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着XML数据的受到越来越多应用开发者的欢迎,对XML的标签树和标签图数据模型的检索处理成为了一个重要的研究课题。而XML索引是有效检索XML的自然途径。 结构摘要作为一种重要的半结构数据索引技术,经常地用于XML索引中。结构摘要在XML检索中充当动态提取并自动维护的模式信息。从Dataguides开始,已经在文献中出现了若干可应用于XML的结构摘要索引。 本文致力于建立一种支持分支路径表达式的自适应XML结构摘要索引。为此,本文引入一种双拟关系以及基于双拟关系的结构摘要索引。在已经发表的结构摘要索引中,F&B索引通过从正反两个方向计算双拟关系的方法使索引支持分支路径表达式。但实验证明F&B的空间效率不能满足应用的需要。本文从另一个角度作出了尝试,扩展双拟关系而得到一种双向双拟关系。根据双向双拟关系划分节点得到的索引与F&B索引同样地可以支持分支路径但在应用方式上更为自由。通过在M(k)-index的基础上应用局部化双向双拟关系可以得到一种支持分支路径表达式的自适应XML结构摘要索引。研究表明该索引可以安全地检索分支路径表达式并准确检索高频访问的分支路径表达式。本文在最后为该索引在应用中如何进一步优化提供了建议。
其他文献
非线性科学是一门研究非线性现象共性的基础科学,其中混沌理论是非线性科学的一个重要分支。由于混沌系统具有复杂的动力学行为,人们开始研究混沌的控制和混沌同步的问题。本
软件复用是在软件开发中避免重复劳动的解决方案,是解决软件危机的有效手段。基于构件的软件开发是当前最具潜力的软件复用方法,构件库系统是基于构件的软件开发核心。而构件
研究用户日用电负荷数据的特征,有助于电网公司对用户的用电行为有更透彻的理解。如果能依据用户异常用电数据的离群特性建立基于机器学习的用电异常行为检测系统,对于电力行业和智能电网的发展具有重要的意义。论文在基于对数据预处理和机器学习方法理论研究的基础上,结合电网用电数据特征,针对如何建立有效的异常检测模型以提高用户用电异常行为检测的算法性能,进行了深入的分析研究。主要工作内容如下:首先,介绍了用电异常
学位
随着互联网技术的迅速发展,网上的文档数据在飞速增长,在这些海量的Web结构页面中蕴藏着巨大潜在价值的知识,如何快速、有效地发现潜在知识,成为数据挖掘技术一个重要的研究
当前商品防伪技术存在很多不足,如利用印刷和电码查询技术作为主要防伪手段,因制造工艺技术的简单,在防伪打假中存在防伪周期短和容易伪造等弊端,迫切需要一种全新的商品防伪技术
目标追踪技术是计算机视觉研究领域中比较活跃的课题之一。随着计算机软硬件的发展,目标追踪技术已经在多个领域得到了应用,相关的算法研究日益深入。粒子滤波追踪算法作为一
数据仓库技术在决策支持系统中发挥着关键的作用,它对决策支持系统提供一些商业信息,从而提高策能力。然而,构建数据仓库仍然是一项富有挑战性和复杂性的任务,主要是因为数据
网格技术是当前计算机技术发展的一个重要方向,它把用通信手段连接起来的资源无缝集成为一个有机整体,给用户提供一种基于互联网的新型计算平台。网格信息服务是网格系统中的
图论是离散数学的骨干分支,离散数学则是计算机科学技术与网络信息科学的思想基础。近年来由于计算机尤其是大型计算机的发展,使得图论在数学,物理、化学、地理、生物等基础学科
随着集成电路工艺和计算机自动化控制技术的发展,基于多核架构的实时系统得到广泛应用,特别是在数字控制、指挥控制、信号处理以及军事领域等方面发挥着重要的作用,使得基于多核