基于TxXgene的XML文档自动化生成系统的设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户：djy0702

【摘要】

：

目前，XML文档数据得到越来越多的应用，尤其是在Web应用中。随着XML基准的不断改进以及XML文档应用数量和规模的日益增大，在这些应用的测试中对XML文档数据的需求，无论是数量上，还

【作者】

：

高小红

【机构】

：

南开大学

【出处】

：

南开大学

【发表日期】

：

2011年期

【关键词】

：

XML文档自动生成系统谓词模式 ToXgene工具关系数据库数据库引擎

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前，XML文档数据得到越来越多的应用，尤其是在Web应用中。随着XML基准的不断改进以及XML文档应用数量和规模的日益增大，在这些应用的测试中对XML文档数据的需求，无论是数量上，还是质量上都有很高的要求。真实的XML文档数据由于很多原因不能随便获得，因此，合成XML文档的研究十分重要。　　本文研究了国内外比较常用的XML文档生成工具，分析和总结了各种工具生成XML文档的过程和优缺点，选定以ToXgene工具为基础，设计一个XML文档自动化生成系统。本文深入研究了ToXgene的体系结构和语法知识，对语法成份进行分析和分类，使用面向对象思想，设计模板文件(源文件)的自动生成算法；设计多种类型数据丰富生成内容，每一种类型使用一个类来实现，便于升级和扩充；研究自然语言生成理论，引入Schema方法思想，设计良好知识库结构和算法，生成可读性良好的文本；设计文件管理模块，处理系统自动生成XML文档过程中的文件操作。　　本文的系统成功实现了XML文档的自动化生成过程，可以快速生成大批量连续，具有复杂结构和内容的XML文档，而且系统具有很强的通用性，并实际应用于国家863项目《无缝集成关系数据库系统的纯XML引擎研制与关键技术研究》的调试与评测中，向其提供了优质海量小XML文档和一些大XML文档，很好的支持了数据库引擎的功能测试和性能测试。　　

其他文献

哼唱搜索技术的研究与实现

哼唱搜索(Query by Humming)是一种基于内容的音乐搜索技术，它是涉及信号处理和模式识别等领域的综合研究课题。与传统的基于文本的搜索不同，哼唱搜索为人们提供了一种很自然的

学位

哼唱搜索音乐搜索音高追踪音乐数据特征库K-means聚类字符串模糊匹配

基于词典与日志挖掘的查询扩展问题研究

在信息检索系统中，由于用户查询语句过短而导致的词不匹配、信息迷向和信息过载等问题，成为制约检索质量的主要因素之一。实践表明，根据一定的策略为原查询语句附加更多的关键词

学位

信息检索查询扩展统计语言模型似然比日志挖掘数据平滑策略

度量空间索引与查询技术研究

随着计算机、互联网、通信以及定位技术的快速发展，科学计算、社会生活及工业生产不断产生出各类复杂数据。这些数据在形态上具有海量、高维、多源、异构、不确定/不完整等特

学位

度量空间索引结构数据查询信息挖掘

分数阶Fourier变换在三维模型处理中应用

随着计算机图形处理能力和互联网技术的飞速提高,三维模型的获取和处理愈加方便,三维模型的应用变得越来越广泛。在三维模型处理领域,基于形状的三维模型检索技术和三维模型

学位

三维模型检索三维数字水印分数阶Fourier变换特征提取球形螺旋线

重要水产养殖动物病害专家诊断系统的研制

近些年来，我国水产养殖业取得了迅速发展，但因为相配套于水产养殖业生产的服务措施相对比较落后，特别在水产养殖动物病害诊断、预防及治疗方面总体上还处于较低水平，水产养殖动物

学位

水产养殖动物病害专家诊断系统案例推理后台数据库

多尺度配置真实感光渲染并行算法研究

本文的研究领域涉及计算机图形学、计算科学以及并行计算技术，针对图形学研究领域的一个关键技术——真实感光照渲染理论，引入多尺度配置计算方法，研究并提出基于正交递归二分法

学位

真实感光照渲染多尺度配置图嵌入空间分解法并行计算动态负载平衡

基于加权直觉模糊支持向量机的图像分割技术

传统的模糊支持向量机中的隶属度是由样本点到类别几何中心的距离来确定的，在较大程度上消除噪声点或孤立点的同时也削弱了类边缘支持向量对分类超平面的影响。直觉模糊支持向

学位

直觉模糊支持向量机加权直觉模糊支持向量机图像分割权值

音素候选者生成器的研究

当人们使用搜索引擎在互联网中检索信息时，查询词中会出现拼写错误，这严重阻碍了人们获得其所需信息。这些拼写错误可分为两类：打字错误和认知错误。其中，认知错误是指人们知道某

学位

音素候选者生成器音素相似度搜索引擎机器学习

IPv6网络的漏洞测试研究

虽然IPv4对Internet的发展做出了巨大的贡献,并在四十多年的应用中证明了它的健壮性,但是随着Internet迅猛发展,网络规模爆炸式的扩张,IP地址空间严重不足,网络性能变差,路由

学位

IPv6网络漏洞THC IPv6网络攻击工具Wireshack

熵在BP网络泛化增强技术中的应用

神经网络是机器学习中最重要的模型之一,它基于无次序、无规则的样本数据集,试图从中提取出描述此样本数据集特征的数学模型。其中,BP神经网络因其结构简单、算法易于实现且

学位

前馈神经网络泛化能力梯度下降方法惩罚项信息熵

基于TxXgene的XML文档自动化生成系统的设计与实现

其他学术论文