论文部分内容阅读
与传统的二维视频相比,立体视频能够提供更加真实和自然的视觉体验,具有非常广阔的应用前景。然而立体视频数量巨大,如何高效的压缩立体视频数据是一个关键问题。为此,本学位论文针对最新一代立体视频编码标准3D-HEVC,从视觉感知的角度出发,对立体视频编码中的率失真优化及码率控制两个核心技术展开研究。 传统的率失真优化技术使用误差平方和(SSE)或绝对差和(SAD)来度量失真,并不能获得较好的视觉感知质量。为此,本文提出了一种使用结构相似度(SSIM)来度量失真的率失真优化方法;首先根据 HEVC编码树形单元(CTU)结构设计了基于SSIM的失真计算方法;然后,提出了一种基于量化器推导的码率-量化步长(R?¢)模型和一种基于统计分析的失真-量化参数(DSSIM? QP)模型,用于求取拉格朗日乘数;最终使用多 QP优化的方法求取模型参数。实验表明,相对于传统的率失真优化,针对固定 QP编码和多 QP优化编码,在相同的SSIM条件下,码率分别平均降低8.4%和13.9%左右,同时编码复杂度分别平均仅增加了大约3%和2%。 本毕业论文通过实验发现3D-HEVC的码率控制算法在低目标码率的情况下,出现视点间重建图像质量差异过大,从而引起感知质量严重下降的问题。为此,本文提出了一种基于视点间联合比特分配的改进方案。实验表明,改进后的码率控制算法,在低码率下仍可以保证视点质量的一致性,且在相同码率下 PSNR提升了近2dB。 由于双目视觉存在掩蔽效应,即构成立体图像的左右图像对,质量好的视点图像对整体的立体图像感知质量贡献较大。为此,本文探索性的设计了主观实验,从纹理信息入手,定量的研究其对视觉感知阈值的影响。实验表明,纹理越复杂,可容忍的感知阈值越大;左视点编码 QP越大,阈值越小。实验得到了一个空间斜面模型,用于预测双目视觉感知阈值的大小,可以很好的应用于立体视频编码中,例如码率控制以及感知量化等。