论文部分内容阅读
信息科学一个重要的课题是如何准确、有效、简洁的表示图像数据,图像压缩是其中的一种简洁的表示图像数据的有效手段,它以较低的资源(信道)和经济代价实现了人类观看和使用视觉信息的目的。图像信息的压缩处理,首先可利用无损的熵编码,用以去除图像数据自身的信息冗余,其次可利用预测编码,消除数据之间的统计冗余,同时也有必要按照人眼视觉系统对某些特征不敏感的特点,允许合适的误差而不必传输过多的细节,在图像的质量不明显下降的前提下,使图像的压缩率更大。对于人眼视觉系统特性的深入研究,得到准确的适用于大范围图像的人眼敏感程度、可容许误差的模型,就成为了视觉自适应图像编码的关键环节。人眼对于视觉内容的可容许误差称作最小可觉失真(Just Noticable Distortion)或是最小可觉差(Just Noticable Difference),简称JND。利用JND模型,可以对人眼视觉系统在一定条件下对于图像内容的可容忍误差的预测估计。本文对于图像域的JND建模中的照度适应性因素进行了探讨,阐述了这一因素的生理机制背景,并介绍了一种使用广泛的照度适应性模型。对于已有的照度适应性建模模型进行了参数化改造,使得这一模型成为可调模型,在更为广泛的实验室环境下通过参数的选择,得到具有普遍性的照度适应性模型。重点探讨了对比掩蔽因素的两种效应,即纹理掩蔽因素、边缘掩蔽因素。对于边缘掩蔽现象作了较为深入的探究。通过引入特征整合理论、认知模型,根据认知模型下的对比掩蔽因素的假设,即人眼对纹理部分能够容纳更多的噪声,而边缘部分敏感性反而提高,提出了一种模拟认知过程的边缘检测方法,并将其应用于JND建模中。通过主观质量评估,比较JND控制下的图像加噪声图像质量,与已有的图像域建模模型相比较,说明了该假设的合理性及其实现的有效性。最后提出了将图像域JND模型应用于JPEG压缩的方案。其中利用了对变换结果的量化与图像的误差、JND值之间的关系,以及DCT变换域中某些频率对于视觉的影响较小的特点,最后对实验结果做出了初步的讨论。对于图像域JND研究中的一个方法问题,也做出了评价与改进意见。