论文部分内容阅读
传感器技术的飞速发展,使得图像的分辨率越来越高,给图像数据的传输、存储和处理带来巨大挑战,且根据人眼视觉系统特性,总是优先关注图像中显著性区域,为此,本文提出一种面向显著性区域保护的图像压缩算法。主要针对以下两个问题进行了深入研究:一是由于当前利用神经网络进行显著性检测的模型需要明确显著性区域与背景的边界,对训练数据要求高,且存在多目标图像内容不能被有效感知的问题;二是在取消对获取显著图明确边界限制的基础上,如何准确分离显著性区域与背景区域,实现在压缩时对显著性区域的有效保护。针对上述问题,构建了一种多尺度深度特征显著区域(Multi-Scale Depth Feature Salient Regions,MS-DFSR)检测模型,并提出面向显著性区域保护的图像压缩(Image Compression for Salient Regions Protection,SRPIC)算法。首先,通过构建一个深度卷积神经网络模型提取输入图像的深度特征,结合全局平均池化和类激活映射模块,实现了显著目标定位,并采用最大平均池化和多尺度概念检测图像中的多个显著目标,提高了模型对图像中多个显著目标的有效感知,且数据只需图像级标签;其次,本文利用改进的OSTU阈值算法有效分离了显著性区域与背景区域;最后,将构建的MS-DFSR模型结合压缩技术,显著区域近无损压缩,背景区域有损编码压缩,完成了面向显著性区域保护的图像压缩与重建。本文实验分为显著图分割算法有效验证、MS-DFSR检测模型对图像内容感知有效性验证、不同码率下图像压缩实验和MS-DFSR结合不同编码算法实验。实验数据为在Kodak Photo CD数据集和Pascal Voc数据集。实验结果表明:提出的SRPIC算法得到了较传统编码技术更优的结果,说明了本文算法通过MS-DFSR检测模型有效地感知了图像中的多个显著目标,并通过改进的OSTU阈值算法有效地分离了显著区域与背景区域,使得在图像压缩过程中,减少了图像内容损失,从而提高了压缩后重建图像的质量。该论文有图25幅,表4个,参考文献65篇。