论文部分内容阅读
在下一代视频技术中,立体视频作为一种比普通视频提供更多信息内容和具有更多数据量的数字媒体,因其具有强烈的立体感和纵深感特性越来越受到人们的关注。然而立体视频具有两倍于单目视频的数据量,这给存储和传输带来困难,必须对其进行高效的压缩。在立体视频中,除了各个视频流内具有很强的空间和时间相关性之外,各视点之间也具有一定的交叉相关性,如何有效地去除这些相关性是立体视频走向实际应用的关键。为提高立体视频的压缩效率,本文根据人眼视觉系统的隐藏特性,对立体视频采用非对称压缩编码的相关技术进行了研究。
论文首先对基于H.264的立体视频编码技术及其相关参考模型JMVM进行深入研究,并分析了三种传统立体视频编码方案的优缺点。在此基础上,得出了视差补偿预测、运动补偿预测及其联合补偿预测方法的不同适用环境。运动补偿预测方法适合于在不运动的背景区域或运动缓慢的前景区域以及相邻两帧中的遮挡区域;视差补偿预测方法主要适合于运动引起的遮挡、变形区域;而联合补偿预测方法更适合于物体的边缘区域。
其次,在根据人眼视觉特性的基础上,分析了非对称视频编码应用的可能性。针对现有非对称立体视频编码算法中右视点图像在参考左视点图像时存在的分辨率不匹配问题,提出了一种快速的匹配算法--参考帧直接预测模式,该算法与对左视点参考帧进行动态下采样算法相比,降低了编码的复杂度。同时论文分析了非对称立体视频编码过程中的右视点下采样图像编码失真度原因,实现了一种更有效的非对称立体视频压缩编码算法,能够根据目标码率动态选择下采样尺度,在失真度和码率之间寻找一个最优平衡点。
第三,针对非对称立体视频编码算法其右视点图像在中高码率条件下重建质量较低的不足,提出了基于宏块残差下采样算法。并根据图像不同方向的运动情况,采用了三种下采样方式,减小采样失真度。根据立体视频编码中运动补偿预测、视差补偿预测和联合补偿预测三种不同的预测模式,来判断当前编码块的运动剧烈程度,实现了自适应的残差宏块下采样方法。实验结果表明,相对于JMVM中提出的算法,本文算法在近乎相同的编码图像质量条件下,具有更高的编码效率。