论文部分内容阅读
目前,XML文档数据得到越来越多的应用,尤其是在Web应用中。随着XML基准的不断改进以及XML文档应用数量和规模的日益增大,在这些应用的测试中对XML文档数据的需求,无论是数量上,还是质量上都有很高的要求。真实的XML文档数据由于很多原因不能随便获得,因此,合成XML文档的研究十分重要。
本文研究了国内外比较常用的XML文档生成工具,分析和总结了各种工具生成XML文档的过程和优缺点,选定以ToXgene工具为基础,设计一个XML文档自动化生成系统。本文深入研究了ToXgene的体系结构和语法知识,对语法成份进行分析和分类,使用面向对象思想,设计模板文件(源文件)的自动生成算法;设计多种类型数据丰富生成内容,每一种类型使用一个类来实现,便于升级和扩充;研究自然语言生成理论,引入Schema方法思想,设计良好知识库结构和算法,生成可读性良好的文本;设计文件管理模块,处理系统自动生成XML文档过程中的文件操作。
本文的系统成功实现了XML文档的自动化生成过程,可以快速生成大批量连续,具有复杂结构和内容的XML文档,而且系统具有很强的通用性,并实际应用于国家863项目《无缝集成关系数据库系统的纯XML引擎研制与关键技术研究》的调试与评测中,向其提供了优质海量小XML文档和一些大XML文档,很好的支持了数据库引擎的功能测试和性能测试。