论文部分内容阅读
步入信息化时代,以数字视频为代表的多媒体数据迎来了急速的增长,丰富的视频内容已成为我们获取信息的主要载体。虽然数字视频因其直观性的优势在各种通信应用中倍受青睐,其庞大的信息量也对数字设备的存储能力及网络带宽提出了很高要求,并极大地阻碍了人们对视频数据的获取与使用。因此,开发高效的视频编码技术,通过压缩方式存储与传输视频数据对视觉通信和多媒体相关产业的发展具有重要意义。去除视频数据中的各种冗余是视频编码的主要目标。首先,在客观上,视频数据的空域和时域近邻像素均存在较高的相关性,需要通过精确的预测编码技术来降低这些时空冗余。然而,受到帧内/帧间预测精度的限制,现有视频编码标准的压缩性能依然无法满足人们对高清、超高清及多视点视频等内容的传输需要。开发更高精度的帧内/间预测技术已成为多媒体通信领域的迫切需求。其次,在主观上,人类视觉系统对不同图像内容下失真的敏感性呈现明显差异。如何利用人眼视觉特性开发准确的感知质量评价测度,并以此指导编码模式及参数的选择,是降低感知冗余、提升视频编码压缩效率的关键。基于上述考虑,本文开展了对高效视频编码及其感知质量评价方面的研究。本文工作主要从提高视频编码压缩效率及重构视频的主观质量两个方面入手。在开发高效压缩编码工具的同时,我们进一步设计了基于人眼视觉特性的图像感知质量评价方法,并据此来优化压缩视频的后处理参数。具体的研究内容和创新点包括以下五个方面:1.高性能视频帧内预测方法图像中近邻像素间的相关性与空间距离和局部纹理方向均存在着密切联系。传统的方向性帧内预测(Directional Intra Prediction)忽略了待预测像素与参考像素空间距离的变化,并对宏块主方向上像素采用相同的预测值。随着待预测像素与参考像素空间距离的增加,其预测精度也不断降低。为了解决这一问题,本文建立了一种兼顾宏块主方向和空间距离的预测距离模型,并据此提出了一种依赖模式的自适应下采样与插值帧内预测方法。该方法可有效降低待预测像素和参考像素间的预测距离,提高帧内预测精度。为进一步提高视频编码框架整体压缩性能提供了基础。2.高性能视频环路滤波方法环路滤波器是视频编码框架的重要组成部分。其主要任务是降低压缩图像相对于原始图像的失真,并为后续的帧间预测提供有效的参考帧。传统的去块效应环路滤波器(Deblocking Loop Filter)忽略了不同图像内容的差异,并采用固定的低通滤波方法来抑制编码造成的块效应失真。对于场景复杂的局部区域,该方法往往会丢失丰富的局部细节。为了解决这一问题,本文提出了一种依赖模式的自适应环路滤波方法。该方法根据帧内预测模式提供的局部纹理信息来在线训练一系列滤波器组,从而对不同的图像内容执行对应的滤波操作。在抑制块效应的同时,进一步保留图像细节。3.高效率无参数感知质量评价有效的图像感知质量评价算法是对视频压缩服务进行质量评估、监控和增强的重要基础。由于用户端往往只能访问编辑后的视频及图像内容,因此不借助原始图像信息的无参考图像质量评价算法在实际应用中有着更为迫切的需求。本文提出了一种基于多通道特征融合与标签传递的方法用于图像感知质量评价。在图像描述和质量预测方面,该方法可有效模拟人类视觉的分层属性及视觉记忆搜索过程,从而获得与人类视觉感知一致的预测结果。由于我们的标签传递模型无需参数学习过程,因而能够以较低的复杂度高效完成图像感知质量评价。4.高性能参数化感知质量评价对于无参考图像质量评价,无参数的预测模型具有低复杂度的效率优势。然而,由于缺乏监督信息的有效修正,其预测精度尚有待进一步提高。为此,本文提出了一种基于多域结构性信息与分段回归的无参考图像质量评价方法。一方面,我们结合空域和频域结构性信息来捕捉图像的自然场景统计变化。另一方面,我们通过在线学习对每幅测试图像训练特定的参数化质量预测模型。该方法可有效捕捉特征空间内各局部数据的分布,因而可更加准确地预测图像的感知质量。5.感知驱动的图像去块效应滤波去块效应滤波是提升压缩视频感知质量的关键。传统的环路滤波器通过预定义的低通滤波操作来抑制重构图像的块效应。由于缺乏有效的反馈机制,视频发送端与接收端均无法判断用户对滤波图像的感知质量,并进行画质的有效增强。为了保证处理后的重构图像得到用户满意的主观感受,我们提出了一种感知驱动的去块效应滤波方法。该方法采用参数化的形状自适应DCT滤波器来执行去块效应滤波,并使用本文提出的无参考图像质量评价算法进行重构图像质量的监督和反馈。借助质量反馈的结果,我们便可求解出感知最佳的滤波参数。实验显示,本文的方法可有效提高压缩视频的主观质量。