论文部分内容阅读
近年来,随着XML数据的受到越来越多应用开发者的欢迎,对XML的标签树和标签图数据模型的检索处理成为了一个重要的研究课题。而XML索引是有效检索XML的自然途径。
结构摘要作为一种重要的半结构数据索引技术,经常地用于XML索引中。结构摘要在XML检索中充当动态提取并自动维护的模式信息。从Dataguides开始,已经在文献中出现了若干可应用于XML的结构摘要索引。
本文致力于建立一种支持分支路径表达式的自适应XML结构摘要索引。为此,本文引入一种双拟关系以及基于双拟关系的结构摘要索引。在已经发表的结构摘要索引中,F&B索引通过从正反两个方向计算双拟关系的方法使索引支持分支路径表达式。但实验证明F&B的空间效率不能满足应用的需要。本文从另一个角度作出了尝试,扩展双拟关系而得到一种双向双拟关系。根据双向双拟关系划分节点得到的索引与F&B索引同样地可以支持分支路径但在应用方式上更为自由。通过在M(k)-index的基础上应用局部化双向双拟关系可以得到一种支持分支路径表达式的自适应XML结构摘要索引。研究表明该索引可以安全地检索分支路径表达式并准确检索高频访问的分支路径表达式。本文在最后为该索引在应用中如何进一步优化提供了建议。