XML结点编码索引方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:jxpyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展标记语言(Extensible Markup Language,XML)具有可扩展性、平台无关性以及简单易于处理等优点,逐渐成为Internet数据表示和交换的标准。随着XML存储机制与查询语言的日益成熟和XML应用的普及,如何更快、更精确地查询XML数据成为日益突出的问题。对XML文件构建索引机制是提高查询速度的有效方法。但是目前已有的XML索引方法还存在很多缺陷:如查询效率不高、动态更新性能差、结点连接代价高昂等。本文试图提出一种有效的XML索引,以改善现有索引方法的效率。   本文深入研究了XML索引技术,分析XML数据结构、查询语言以及编码方法对索引查询效率的影响。在此基础上,提出一种基于Schema的XML结点编码索引方法(XML Node Coding Index,XNCI)。该索引方法可以减少结点的连接操作次数、有效地支持复杂路径查询、并且支持数据动态更新。主要工作体现在以下几个方面:   1.本文在结点编码方法中引入路径编码思想,对Dewey编码进行改进,提出一种支持动态更新的路径前缀编码方法(Path—DeweyCoding,PDC),用于XML文档中分支路径的匹配和连接操作。   2.深入研究已有的XML索引方法,分析并总结结点编码索引的优点,提出一种基于Schema的XML结点编码索引方法——XNCI。该索引利用XML的模式信息来加速查询,对Schema和XML分别编码,并将PDC应用于XML编码中。   3.本文针对XNCI的索引结构,提出一种新的路径划分方法,将复杂查询路径划分为谓词结点和目标路径。利用结构表提高谓词结点的查询效率,从而提高了整个路径查询的效率。   4.为了进一步验证本文提出索引的有效性,设计了这种XML结点编码索引系统,实验证明研究提出的索引具有较好的检索效果。
其他文献
随着科学技术进步和社会发展,视频监控系统已经被应用到了社会的各行各业,起到了不可低估的作用。市场上应用比较广泛的是有线网络传输的图像监控系统,而这种系统在郊区、深
铝土矿浮选过程中,泡沫层能够直接反应浮选的质量指标。目前,有经验的操作工人主要通过观察浮选作业表面泡沫的视觉信息调整操作,但是由于浮选操作的不确定性和随意性,难以保
恶劣的工业环境会使ISA 100.11a DL子网中数据传输出现报文丢失、误传、不确定的延迟等,这些都可能给工业现场带来灾难性的后果。而ISA 100.11a DL子网中的路由技术在网络的
聚类分析作为一种非监督学习方法,随着现代科学特别是计算机科学的发展,已经被广泛应用于人们的生产、生活领域。在理论研究及实践应用中,人们己经相继提出了许多聚类算法,但
SEMG检测系统,即表面肌电信号检测系统,它作为一种无创检测方法,在临床诊断、康复工程、运动医学以及人机仿生系统等方面具有重要意义。表面肌电信号指的是当骨骼肌收缩时,肌
在工业领域中,仪器仪表的智能化程度越来越高,工业无线技术正在工业领域内发挥着越来越大的作用,作为三大主流工业无线标准之一的ISA100.11a标准已经完善。   随着ISA100.11a
由于催化裂化是石油二次加工的主要方法之一,因此本文首先根据集总反应动力学模型以及烧焦动力学模型,建立并求解催化裂化稳态机理模型。通过对引入流和积的物料表达方法,对
紫外线灯广泛应用于医疗卫生、印刷固化等工业领域。因此良好的紫外线灯的照度控制系统性能必然能将其优点发挥到极致,从而更好地为人们的生活、生产服务。同时随着现代电力
自1990年加拿大学者McGeer的开创性工作以来,被动步行由于其天生具有自然步态以及类似人类步行的能量效率,因此迅速吸引了双足机器人领域研究人员的注意,并逐步成为该领域的研究
目前,基于静态单帧图像的监控模式主要应用于监控点分布较广、实时性要求不高与不需要连续监控的应用场景中。其中,监控图像中的感兴趣区域(Region of Interest, ROI)提取与