论文部分内容阅读
日益增多的多媒体应用产生的海量数字图像对存储和传输都产生了巨大的压力,因此,对高效的数字图像压缩编码技术的研究具有重要意义。原始图像数据中存在着各种冗余,图像压缩的目的就是要去除这些冗余。传统的图像压缩方法以信息论为指导,从信号处理的角度出发去除图像中的各种冗余,并取得了较好的效果,如广泛使用的基于离散余弦变换(DCT)的JPEG图像压缩标准和基于离散小波变换(DWT)的JPEG2000标准。但是在受终端设备处理和存储能力以及传输带宽的限制而产生的低码率图像压缩应用场景中,传统图像压缩方法受其固有特性的影响会产生块效应和振铃效应,严重影响了图像质量。
针对这一问题,本文从计算机视觉的角度出发,利用人类视觉系统的特点以及图像基元图信息的可复用性,提出了一个基于图像基元图学习的低码率图像压缩方案。
该方案针对人眼更敏感的边缘区域进行处理,从一组训练图像中提取出通用的可在低码率压缩图像之间复用的基元图信息,并以非参数化表示的形式将其保存在库中。在图像编码端只需要压缩下采样之后的低分辨率图像,其丢失的高频信息就可以在解码端利用库中的基元图信息近似地恢复出来。因此在相同的码率下能获得更好的图像重建质量。其中用基于优化的方法提高了基元图复用时映射的准确程度,用基于块拼接的方法来保证基元图映射时相邻块之间的一致性。
在此基础上,利用信号的稀疏表示方法对上述方案进行了改进。超完备冗余表示和信号稀疏表示的最新研究成果表明:一个信号可由超完备字典稀疏表示;由于高分辨率图像和对应低分辨率图像之间具有的几何相似性,高分辨率图像块的几何特征可以从对应低分辨率图像块获得。将这一思想用于基元图映射,即对每一个低质量基元图块求出其用超完备字典的稀疏表示,则对应的高质量基元图块可以通过这些稀疏系数与字典中对应的高质量基元图块组合得到。该问题可以用1范式最优化的方式描述并求解,并且把相邻块之间的一致性作为一个约束条件加入该问题的求解以进一步增强基元图映射时相邻块之间的一致性。
实验结果表明,在低码率下,采用本文中的图像编码方案重建的图像的主客观质量均优于JPEG和JPEG2000。