论文部分内容阅读
数据压缩的研究一直是科学技术中的热点,其在数据存储和传输方面有着广泛的应用。虽然随着现代科学技术的突飞猛进,网络传输速率不断地提高和数据存储设备的容量呈指数级增长,但是数据的多样性和爆发式的增长,使得高效的数据压缩技术成为有效降低存储量和传输成本的重要技术。其中无损数据压缩技术在医疗、航天、通信等领域获得了广泛的应用。本文首先介绍了数据压缩的基本理论和后缀数组的构造,以及数据压缩涉及到的常用算法——基数排序、最小堆、二叉树、哈夫曼树编码、动态哈夫曼树编码、Run-Length编码等算法。结合实际应用需要的基础上,本文提出了用动态哈夫曼树编码方式代替哈夫曼树编码方法。它对数据进行编码方式的依赖取决于动态变化的哈夫曼树,并且它对需要编码的字符串只扫描一遍,同时,没有必要为解压而保存动态哈夫曼树的相关信息,从而减少相应的数据存储量。最后,本文提出用模式匹配算法处理由二进制编码组成的字符串。先分析Brute-Force算法、KMP算法和Boyer-Moore算法的优点和劣势,然后用实验证明BM模式匹配算法具有高效性,从而提高压缩率,改善压缩效果,节省存储空间等。