基于更新标识符的改进分数编码方案研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:p54188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,XML已经成为Web数据存储、表示和交换的重要标准。XML具有良好的可拓展性与开放性、较高的压缩比、能够保证数据的结构完整性等诸多优点,但同时它也存在冗余信息多、分支结构多等缺点。如何高效管理XML数据成为XML技术领域的研究热点,为此学者们提出了很多特定的编码方案。这些数据编码方案在很大程度上提高了XML数据的编码和管理效率,但也存在一些不足,比如查询效率不高,当XML数据频繁或者大幅度更新时需要重新编码、更新代价较大。本文就此开展相关方面的研究。本文在深入分析已有编码方案的基础上,提出了一种基于更新标识符的改进分数编码方法UIFES,该编码将结点信息和路径信息分解,分别保存在不同的表中,避免记录重复的结点信息和路径信息,节省了存储空间;同时该编码将所有的结点路径保存在路径信息表中,在查询时通过路径编号来查找结点位置,避免了现有查询算法的结构连接操作,而且不受查询路径表达式长度和中间结果集规模的影响,大大提高了查询效率;最后该编码利用分数界定码和更新标志码来解决预留空间用完的情况,使得在某些特殊情况下都不需要重新编码,更新代价很小,极大地提高了编码的更新效率。总结来说,本文的主要工作如下:⑴深入分析了现有的XML数据编码方案,并指出了这些编码方案各自的优缺点。⑵提出了一种新的XML数据编码方案,即UIFES编码。该编码综合运用了分数编码和前缀编码的优点,既能有效支持结点的动态更新,又具有较高的查询效率。与前缀编码相比,它的查询效率更高;与分数编码相比,它的动态更新性能更好。⑶针对本文提出的编码方案详细说明了相关定义和实现算法;对编码的特性进行了介绍,给出了编码更新算法和查询算法,并结合实例讨论了插入新结点后编码的更新情况,详细说明了查询过程。⑷通过实验对UIFES编码和其它对照组编码在静态编码效率、动态更新效率、查询效率等方面进行了分析和比较,验证了UIFES编码的有效性。实验结果证明,与现有的编码方案相比,UIFES编码在静态编码效率、动态更新效率和查询效率等方面都具有较大的优势。
其他文献
随着互联网的飞速发展,Internet上的Web服务数量正在急剧增长。Web服务发现的任务就是要从数量庞大的服务群中找到满足用户需求的服务,其核心技术包括服务描述语言和服务匹配
随着云计算技术的快速发展,各种基于云平台的新型Web服务不断被提出,为了实现跨平台性,基于JavaScript语言的B/S模式是这些服务的主要交互方式。而且用户可以使用浏览器直接
医疗保险是将发生保险合同约定的医疗行为作为给付保险金的先决条件,向被保险人提供在接受诊疗期间所产生的医疗费用支出的保险保障服务。可以保障患者因为就医带来的经济损失得以补偿。医疗保险是国家为了服务人民生活、保障人民健康的而设立的重要举措,涉及到每个参保人的切身利益。在利好的同时也客观存在着利益的驱使,医保欺诈行为成为与保险相伴的长期问题,各种欺诈行为屡见不鲜,新的欺诈手段也是层出不穷,流失的保险金是
随着XML数据的可扩展性和自我描述性的日益发展,越来越多的开发者将其视为网络数据传输的主要形式。XML文件本质上是保存信息的结构化载体,它对自身数据库的处理能力是有限的。
需求变更影响应用程序的开发成本和工作效率,快速应对需求变更是当今软件开发的必然要求。为了实现资源的数字化管理,开发了智能能耗监测系统,通过该系统提高了资源的利用效
聚类是数据挖掘中一种深层次的数据分析方法,在数据探索、识别数据的内在结构和经济分析等方面具有极其重要的作用,已成为数据挖掘、统计学和机器学习等领域的重要研究方向。
人脸识别因其广泛的应用前景取得了巨大的发展。由于三维人脸数据包含了二维图像数据中缺失的关键性深度信息,其有望克服或减轻二维图像受光照、姿态、表情变化等因素的影响,
SOA(Service Oriented Architecture),面向服务的架构,是分布式软件系统构造方法和环境的新发展阶段,是用于利用IT实现组织目标的战略手段。但是如何实现SOA,是业界一直争论
BWDSP104X是一款高性能的32位浮点DSP,该体系结构提供了包含浮点以及定点的算术与逻辑等基本的运算指令、数据传输指令、双字指令以及非运算类的指令。为了能够使用C语言来开
随着信息技术的飞速发展,E-Learning学习成为人们在日常生活中经常使用的学习方式之一。由于近年来个性化教学的需求,在E-Learning的研究领域中,基于学习者的学习服务已逐渐