论文部分内容阅读
随着Web技术及其应用的快速发展,XML已经成为万维网上信息表示和数据交换的一个重要的标准,对于Web上涌现的大量XML数据,如何有效地存储和查询XML数据已经成为XML研究方向关注的热点问题。而由于关系数据库是目前最成熟的一种数据管理技术,在各种存储和管理XML数据的方式中,关系数据库显然是一种可行而有前景的方式。但是由于XML数据结构化的特点,在关系模式上进行复杂的结构查询,往往要涉及多个关系表的连接以实现结构关系的判断,这都增加了数据查询的计算量和响应时间。而EXN—Tree结点编码方式简单,结点标志能够有效地“记住”原XML文档结构信息,结构关系的确定非常简单,只需一次移位运算和一次等值运算就可以方便地比较文档中任意两个结点之间的位置关系。
利用EXN—Tree编码的良好特性,本文先是根据XML路径查询表达式两阶段查询的特点,提出了一种通用的关系存储模型STA来存储XML文档,然后在STA存储模型的基础上提出了一个利用EXN—Tree编码来支持XML数据查询的新策略,在这个策略中,本文提出了一个求最近公共祖先结点的最大EXN—Tree编码匹配策略。当执行复杂路径查询时,利用最大EXN—Tree编码匹配策略对XML数据查询中结构连接所产生的中间结果结合进行筛选,可直接得到XML数据查询的结果。相对于传统的基于关系存储的XML查询策略,在处理复杂的XML路径查询时,本文提出的策略更加高效。最后,本文阐述了在STA模式下具体的XML数据查询过程以及和XRel模型查询性能分析的对比,并介绍了实验情况和实验结果。