论文部分内容阅读
XML是W3C于1998年推出的一种标记语言。由于其独特的技术优势,XML推出后很快就成为网络中数据表示及交换的标准。因此,要构建基于XML的各种应用,准确并高效的从XML数据源中查询并获取数据就成为其中关键的一步。论文以自动机技术作为研究基础,对XML文档查询优化技术进行了理论探讨。本文首先对自动机技术在XPath查询中的应用进行了研究。针对基于自动机的XML查询优化技术,介绍了自动机技术用于XML文件查询中的主要思想,对几种基于自动机技术的查询优化方法进行了分析与比较,在对原有模型算法改进的基础上提出了基于树自动机技术的XPath查询模型。给出了单个和多个XPath表达式的模型构造方法,同时给出了基于树自动机的查询模型在XML文档上的运行实例。最后给出了相应的构造算法和运行算法。然后,本文针对目前XML文档查询优化技术研究中存在的不足之处,提出了一种基于视图的高效查询优化方法。此方法包含了两个关键技术:一是链树索引结构;二是基于视图的查询优化技术。我们将这两个技术结合起来,同时将自动机技术也应用于有效视图的选择上,即利用索引结构和自动机技术来从大量的给定的视图中快速有效地查找有效视图。这大大提高了查询的速度,更完善地实现了XML文档的查询优化。最后设计并实现了一个XML文档处理系统。根据前面提出的查询优化技术的基本思想,分析和设计了此系统的体系结构。本系统首先对用户提交的XPath表达式进行有效视图验证,然后通过本文所提出的查询优化技术实现XML文档的查询优化处理,并执行得到查询结果。另外,还设计了两组测试方案对本系统进行测试,并通过实验结果分析,来验证本文所提出的查询优化技术的可行性和有效性。