基于TxXgene的XML文档自动化生成系统的设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:djy0702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,XML文档数据得到越来越多的应用,尤其是在Web应用中。随着XML基准的不断改进以及XML文档应用数量和规模的日益增大,在这些应用的测试中对XML文档数据的需求,无论是数量上,还是质量上都有很高的要求。真实的XML文档数据由于很多原因不能随便获得,因此,合成XML文档的研究十分重要。   本文研究了国内外比较常用的XML文档生成工具,分析和总结了各种工具生成XML文档的过程和优缺点,选定以ToXgene工具为基础,设计一个XML文档自动化生成系统。本文深入研究了ToXgene的体系结构和语法知识,对语法成份进行分析和分类,使用面向对象思想,设计模板文件(源文件)的自动生成算法;设计多种类型数据丰富生成内容,每一种类型使用一个类来实现,便于升级和扩充;研究自然语言生成理论,引入Schema方法思想,设计良好知识库结构和算法,生成可读性良好的文本;设计文件管理模块,处理系统自动生成XML文档过程中的文件操作。   本文的系统成功实现了XML文档的自动化生成过程,可以快速生成大批量连续,具有复杂结构和内容的XML文档,而且系统具有很强的通用性,并实际应用于国家863项目《无缝集成关系数据库系统的纯XML引擎研制与关键技术研究》的调试与评测中,向其提供了优质海量小XML文档和一些大XML文档,很好的支持了数据库引擎的功能测试和性能测试。  
其他文献
哼唱搜索(Query by Humming)是一种基于内容的音乐搜索技术,它是涉及信号处理和模式识别等领域的综合研究课题。与传统的基于文本的搜索不同,哼唱搜索为人们提供了一种很自然的
在信息检索系统中,由于用户查询语句过短而导致的词不匹配、信息迷向和信息过载等问题,成为制约检索质量的主要因素之一。实践表明,根据一定的策略为原查询语句附加更多的关键词
随着计算机、互联网、通信以及定位技术的快速发展,科学计算、社会生活及工业生产不断产生出各类复杂数据。这些数据在形态上具有海量、高维、多源、异构、不确定/不完整等特
随着计算机图形处理能力和互联网技术的飞速提高,三维模型的获取和处理愈加方便,三维模型的应用变得越来越广泛。在三维模型处理领域,基于形状的三维模型检索技术和三维模型
近些年来,我国水产养殖业取得了迅速发展,但因为相配套于水产养殖业生产的服务措施相对比较落后,特别在水产养殖动物病害诊断、预防及治疗方面总体上还处于较低水平,水产养殖动物
本文的研究领域涉及计算机图形学、计算科学以及并行计算技术,针对图形学研究领域的一个关键技术——真实感光照渲染理论,引入多尺度配置计算方法,研究并提出基于正交递归二分法
传统的模糊支持向量机中的隶属度是由样本点到类别几何中心的距离来确定的,在较大程度上消除噪声点或孤立点的同时也削弱了类边缘支持向量对分类超平面的影响。直觉模糊支持向
当人们使用搜索引擎在互联网中检索信息时,查询词中会出现拼写错误,这严重阻碍了人们获得其所需信息。这些拼写错误可分为两类:打字错误和认知错误。其中,认知错误是指人们知道某
虽然IPv4对Internet的发展做出了巨大的贡献,并在四十多年的应用中证明了它的健壮性,但是随着Internet迅猛发展,网络规模爆炸式的扩张,IP地址空间严重不足,网络性能变差,路由
神经网络是机器学习中最重要的模型之一,它基于无次序、无规则的样本数据集,试图从中提取出描述此样本数据集特征的数学模型。其中,BP神经网络因其结构简单、算法易于实现且