XML查询中Twig模式匹配算法的研究

被引量 : 0次 | 上传用户:hnkfxndz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML由于其所具有的自描述性、灵活的数据结构以及丰富的数据表示能力等特点,逐渐成为Web上数据表示、存储和交换的事实上的标准。越来越多的XML数据成为信息共享的载体。大量XML数据的涌现促进了XML数据管理技术的快速发展,Twig模式匹配算法作为XML文档查询处理模块的核心内容,成为众多学者研究的热点问题。在XML结构查询中,可以通过编码来确定节点间的结构关系,避免了对XML文档树的重复扫描,提高了查询效率。早期的二元结构连接算法会产生许多无用的中间结果,降低了性能,针对这一关键问题,论文在分析经典算法PathStack算法和TwigStack算法的基础上展开了深入研究。首先,针对传统XML文档小枝模式查询算法中,与模式树中标签名相同的节点均入缓存,易造成很大的空间浪费问题,提出了ListFWM模式匹配算法。算法在对XML文档编码的基础上,依据节点间的结构关系过滤标签列表中无用的中间节点,且不用归并,通过实验比较,验证了ListFWM算法比TwigStack算法具有更高的查询性能。其次,针对传统算法需要对整个文档节点进行编码,从而导致查询效率大大降低这一缺陷,论文提出了TwigStack算法的核心内容——PathStack算法的改进算法:LocalPathStack算法。以此为基础,提出了一种适用于XML流数据的新的算法: PathList算法,并根据所处理的XML流数据的特点,通过查询根过滤方法优化了这一算法。最后,通过对不同文件大小以及不同查询路径长度的比较实验,验证了PathList及其优化算法与LocalPathStack算法及其优化算法相比,在大大降低了空间复杂度的基础上,具有稍优的时间复杂度,最后提出一种XML数据流的Twig模式匹配算法——StreamTwigList算法,同时给出了论文所研究算法在弹药设计软件中的一个应用案例。
其他文献
腰椎间盘突出症(Lumbar disc herniation,LDH)是由于腰椎间盘变性,包裹髓核的纤维环退变变薄,纤维环机械性撕裂,使髓核从薄弱处或裂隙中突出,压迫神经根造成以腰腿痛为主的临床
<正>落枕是临床上一种常见病,多起于睡眠后,表现为颈项强痛,头颈活动受限,重者疼痛可牵及肩背痛,检查可见胸锁乳突肌、斜方肌及肩胛骨内上角肩胛提肌处压痛明显,肌肉痉挛,颈
当代中国社会还处于由传统社会向现代社会转型的时期。随着社会结构的转化和社会生活的现代化,尤其是社会主义市场经济体制的逐步建立,经济公正问题日益凸显,成为我国当前社会各
红色文化遗产是我国的宝贵财富,具有重要的政治价值、经济价值和文化价值。但目前我国在保护红色文化遗产方面采取的是单一的法律保护模式。这种模式难以达到有效保护目的,因
自2015年1月"伊斯兰国"南亚分支在阿富汗成立以来,该极端组织的兵力、占领区域及其采取的策略经历了一定的变化。目前阿富汗境内"伊斯兰国"分支在驻阿西方部队和阿政府军联合
作为我国最基础的财政单位,乡镇财政会计核算质量对乡镇政府的会计报告有很大影响,会对全国财政数据产生作用。当前我国乡镇财政会计核算体系采用的是收付实现制。尽管工作效率
资料与方法:用症状自评量表(SCL-90)及有关因素调查表对84名老干部进行了自评,其中男50人(>60岁),女34人(>55岁),平均64.7±5.3岁。相关因素调查表内容包括:受教育程度(初中以下24人,高中包括中专43人,大学包括大专17人;婚..
回顾了国内外柴油发电机组自动化控制的发展历程,总结了其现状和以后的发展趋势,分析了国内外主流自动化控制器的功能,指出了国内外行业水平的差异,为柴油发电机组自动化控制