中文互联网数据压缩的单字符编码优化方法研究和实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:zhml0726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何快速的从网络中获得信息引起人们的关注,尤其是在现有的网络设备基础上,如何提高数据传输的速率成为一个热门研究课题。互联网数据压缩是一个可以提高数据传输速率的可行方向,但在现有的压缩算法针对ASCII编码互联网数据传输,对以中文编码的互联网极少针对研究。对通用数据压缩,已有压缩算法很难提高其压缩性能。针对传输数据的特点和现有算法压缩原理,对现有算法进行研究改进是种可行的技术方向,这是本论文研究的方向。本论文对互联网数据压缩中已有压缩算法较全面深入研究和分析,对其压缩原理进行对比研究,针对中文互联网数据编码特点,并且对已有压缩算法做性能实验测试。通过这些研究分析、实验测试基础上,改进压缩算法中对未匹配单字符编码方法进行改进,提高压缩算法对中文互联网数据的压缩率,同时对时间无过高损耗。本论文除了对现有算法研究,还针对压缩算法应用的到互联网数据压缩中具体结合方式进行对比研究。结合改进的算法,对实际的应用原型进行仿真。本论文主要研究内容为:研究现有应用于互联网数据压缩的压缩算法压缩原理,尤其对于未匹配单字符的编码算法;根据压缩算法原理,编码实现现有压缩算法,搭建算法对比测试实验平台,从中文互联网中抓取测试数据样本,测试现有算法的算法性能,以LZJH算法为基础,针对算法中未匹配单字符做性能测试实验;针对算法中未匹配单字符编码方法和中文互联网数据特点,提出单字符编码优化的方法,这是本文创新点之一,并给出优化的算法与现有算法结合方法,对于改进的算法给出理论分析,最后本论文给出单字符编码优化方法和LZJH实施方式,通过改进的LZJH和现有算法对比测试实验,说明本算法可行性;结合HTTP压缩原型,在OPNET网络仿真软件中,实现结合单字符编码优化算法的LZJH算法应用于HTTP压缩中;在OPNET仿真环境,针对HTTP压缩原型系统做测试和分析。除了针对算法的研究工作,本论文还研究并实现:从抓包软件导出数据中分离出实验测试样本;研究路由器的路由算法RIP协议;DNS协议,构建域名服务器。
其他文献
网格中数量众多的资源可能分布于多个不同的信任域中,运行于多种不同的平台和系统之上,采用多种不同的安全机制,如何保障网格环境下安全的互操作是网格安全研究的重要内容之
随着移动互联网以及计算机等相关技术的快速发展,智能移动终端在各行各业得以不断深入和普及。Android操作系统凭借着出色的稳定性和源代码的开放性,不断地提高在智能终端市
入侵检测是一种动态的安全防护手段,它能主动寻找入侵信号,给网络系统提供对外部攻击、内部攻击和误操作的安全保护。入侵检测系统可以记录和禁止网络活动,所以入侵检测系统是防
基于图像的建模与绘制是近些年来兴起的一种新的真实感图形生成技术。IBMR技术是计算机视觉和计算机图形学等学科的综合技术,因此与立体视觉有着密不可分的关系。本文重点研究
VPN(虚拟私有网络)是一种以开放公共网络(Internet)为基础,通过专门的隧道加密技术在公共数据网络上仿真一条点到点的专线技术。利用VPN技术,企业只需要租用本地的数据专线,连接
学位
ATM技术是ITU-T定义的作为B-ISDN的交换技术,具有快速分组交换和统计复用技术的特点,可以有效地支持多种业务(如语音、图像、数据等)。ATM网络优于其它通信网络的一个显著特征
入侵检测技术就是检测企图破坏计算机资源的完整性、保密性和有效性的技术。入侵检测技术已经有20多年的发展历史,在Dorothy Denning提出的通用模型的基础上,人们已经将诸如自
蛋白质构形预测问题就是根据组成蛋白质的氨基酸序列来预测其空间折叠结构。蛋白质是一类重要的生物大分子,是生命活动的主要承担者。只有当组成蛋白质的氨基酸序列折叠成正
Peer-to-Peer技术,也叫P2P计算,是一个新出现的有可能改变下一代Internet架构的研究热点.在P2P系统中,数量巨大的节点(连接在互联网上的电脑)可以聚集在一起共享它们的资源、
语音识别是通过人类说话声音的各种特征,来辨别人类自然语音的语义,或者用来辨别说话人是谁等。随着语音识别系统的发展,语音识别技术被广泛应用到医疗、军事、航空、移动互联网