论文部分内容阅读
本文的探讨了视觉质量优化的数字图像处理技术,研究重点于如何利用人眼视觉系统的特性优化数字图像通信系统的服务质量。主要的研究内容包括人眼视觉系统(HVS)建模,图像质量评价以及图像视频压缩、后处理技术。
HVS的建模及基于HVS模型的图像处理在近年来获得了广泛的关注。由于HVS通常是数字图像通信的最终接收者,在视觉通信系统的设计中考虑HVS的某些特性必将提高系统的处理能力和整体性能。作为HVS计算模型的一个重要应用,图像质量评价算法能够预测HVS对图像视觉质量的主观感受,从而能够在以提高视觉质量为目的的图像通信系统的优化过程中起到重要作用。在已知某些测试数据的主观质量的前提下,图像质量评价算法又可以用来衡量HVS模型的准确度。图像的后处理算法一直以来都是图像处理领域的研究热点。受信源、信道等条件的限制,视觉通信系统接收端获得图像质量常常不能满足HVS的要求,为此我们可以使用图像后处理算法在保证通信系统标准兼容性的同时,提高解码图像的主观质量。本文的具体研究内容分为八章:
在第一章中,我们将首先探讨图像的质量评价算法。本文提出了基于脑科学和神经学中的自由能理论的一种全新的视觉心理图像质量算法。我们将人脑对一幅图像的感知和理解视为一种人脑的主动推理过程。这个过程主要是人脑通过内部自发模型对外界场景进行解释,而图像的感知质量可以近似定义为人脑自发模型对外界感知信号解释的准确性。
生理学和心理学的研究表明人对图像的质量感知在低、高噪声是表现出不同的行为模式。因此第二章探讨了基于在近门限噪声和超门限噪声的不同情况下,如何通过噪声估计和自由能量准则实现对图像质量的无参考评价。
第三章探讨了图像质量准则的一致性问题,研究表明目前的图像质量评价方法存在很大程度上的一致性缺失。因此本章提出了一种对于图像质量认知的突变模型理论,该理论能够很好的解释并克服目前图像质量准则的非单调等缺陷。
第四章的研究表明,目前被广泛认可的基于视觉敏感度加权的图像质量评价方法的研究中很大程度上忽略了人眼视觉系统有限资源分配过程中无法处理过度密集的高视觉敏感度点,即视觉拥塞的问题。在视觉拥塞计算模型的基础上,我们提出了一种全新的视觉敏感度加权方法。
第五章着重研究了基于自然图像统计的图像噪声估计算法。本章首先探讨了噪声对自然图像变换系数高阶距统计量的影响,进而提出了基于选择性离散余弦变换域和随机酉变换的概念,并验证噪声图像在此变换域的三阶、四阶距的尺度不变性,进而提出了有效的自然图像噪声估计方法。
第六章提出了一种资源受限编码器条件下的超高保真(近无损)视频压缩解决方案,为了简化编码器并保持其高效率,编码器采用了一种帧内无穷范数约束差值脉冲编码调制与均匀标量量化器相结合的架构。同时解码使用利用了简单编码器没有利用到的视频信号的空时相关性,通过三维分段自回归视频模型实现高质量视频重建。
第七章设计了一种基于视觉心理学的图像编解码技术,其设计原则是在根据编码端输入图像找到最优生成模型的压缩描述,然后再解码端重新生成输出图像。根据自然图像的像素高阶统计量具有尺度不变性这一统计学上的重要发现,生成模型可以通过在编码器进行空域下采样进行有效压缩;解码器可以相应地通过模式保留上采样模块来生成解码图像。
第八章我们根据参数化的稀疏随机采样和图形的非参模型,提出了一种混合图像修复模型算法,将参数法和非参数法的模型优势在一个多尺度框架中相互结合,参数线性回归模型与非参数核回归模型分别用来描述图像的单尺度内以及多尺度间的依赖性,该算法能够从极稀疏的采样中复原图像。