论文部分内容阅读
近年来,随着拍照设备的不断升级,存储图片所需的内存空间飞速增长,然而硬盘、U盘等存储设备的容量却增长缓慢。不断增长的图片数据量与有限的存储容量之间的矛盾给图像压缩带来了巨大的挑战。深度学习已经在处理目标检测、跟踪、分类等诸多图像问题中取得了巨大突破,然而深度学习在图像压缩领域目前还并没有被充分研究。本文将利用深度学习在图像处理方面的优势,使用深度学习来提升图像压缩性能。本文首先设计了基于卷积神经网络的自编码器,包含图像编码网络和解码网络。编码时,将待压缩的图像输入网络,然后逐步降低图像的空间尺度和特征图数目,并通过量化将对于图像质量影响小的信息去除,从而达到数据压缩的目的。解码时,通过卷积和像素重排结构逐步将图像的尺度恢复,最终重构输入图像。本文在实验中详细对比了量化层、子像素卷积层等结构对压缩效果的影响,对深度网络在图像压缩领域的应用有重要指导意义。然后本文设计了卷积神经网络与JPEG结合的编解码框架。首先将待压缩的图片送入空域冗余去除结构,初步去除因图像局部相似而产生的信息冗余,然后使用JPEG编码,将图片变换到DCT域,通过量化去除对于图像质量影响较小的高频信息。当需要解码时,使用JPEG解码器将图像从DCT域变换到像素域,初步重构图像。由于编码时去除了图像的部分空域和频域信息,直接从JPEG解码器得到的图像视觉质量较差,本文在解码端添加了一个包含17层卷积层的神经网络,将图像在空域、频域的失真逐渐恢复,最终重构出了清晰的解码图像。此框架的创新点在于同时减少了图像在空域、频域的冗余,并通过卷积网络恢复了图像在空域、频域的失真,提高了图像的压缩比率,增加了重构图像的清晰度,最终实现了比传统压缩方法更高的图像压缩比率和视觉质量。相同码率下,由此框架生成的压缩图像,在视觉质量上比JPEG高约3DB。最后本文将前面提出的卷积神经网络和JPEG结合的框架拓展到了图像分类问题中,将分类网络与复原网络联合训练。最终使通过本框架生成的压缩图像,在分类性能与JPEG压缩图像的相近,重构图像的失真更小,压缩比率更高。