论文部分内容阅读
随着人们对视觉观感体验要求的不断提高,对视频场景更加逼真的视觉效果的追求,三维视频系统成为视频研究领域的一个重要方向。与传统的二维视频技术相比,三维视频通过增加深度信息为用户提供自然场景的立体描述,进而为用户带来“身临其境”的视觉感受。此外,三维视频还允许用户进行交互式的视点选择,以方便用户从任意视角和视点对原始三维场景进行观看。由于这些优点,三维视频技术已经逐渐开始被广泛应用于许多领域,如三维电视、自由视点电视、虚拟现实、体育赛事转播以及视频监控等。当前,三维视频系统主要采用基于深度图绘制技术实现,通常包括三维视频采集、三维场景表示、三维视频编码、三维场景绘制以及交互式显示等几个重要的技术环节。其中,三维视频系统采集到的视频数据包含多个视点的视频数据,且往往还有其它的辅助信息。这不可避免地造成三维视频系统拥有巨大的数据量。然而,在实际的应用中,网络带宽和存储资源往往是极其有限的。因此,如何高效地实现三维视频数据的压缩编码是一个亟待解决的重要问题。本文正是在这样的背景下,对三维视频技术中的数据压缩编码问题展开深入的研究,具有重要的理论指导意义和实际应用价值。第一章绪论部分首先阐述了本文选题的背景和意义,随后对当前国内外的研究现状进行了综述并作相应的总结,最后介绍了本课题的主要研究内容和论文结构安排。第二章对三维视频参考视点的选择进行研究,提出了一种基于率失真估计的三维视频参考视点选择方法。该方法首先通过对参考视点压缩失真、虚拟视点合成失真以及纹理视频和深度图压缩码率的详细分析推导出显示视点的整体率失真模型。然后,利用该率失真模型将三维视频参考视点选择问题表示为限制条件下的最优化问题。最后通过求解率失真模型中的几个参数实现了参考视点对于不同码率限制的自适应选择。第三章对多视点纹理视频编码进行研究,提出了一种基于视觉显著性分析的多视点纹理视频编码方法。该方法首先建立了一种新颖的融合颜色信息和运动信息的视频显著性滤波器,并使用该显著性滤波器检测出中间视点的显著性分布。然后,利用三维图像变换获取其余视点的显著性图,并将所有视点的显著性图转换为编码宏块的显著性表示。最后,利用感知视频编码的原理,以宏块的显著性值来控制其编码量化步长,从而实现基于显著性的宏块级的编码质量控制。第四章对三维视频深度图编码进行研究,提出了一种基于恰可识别视差错误估计的三维视频深度图编码方法。首先,根据虚拟视点的合成原理,建立了深度像素的恰可识别视差错误模型,使得任何位于该恰可识别视差错误范围内的深度误差都不会导致虚拟合成视点产生可以被人眼感知到的失真现象。然后,利用该恰可识别视差错误模型指导深度编码过程中的帧内和帧间预测,以减小深度图编码的预测残差。最后,还利用该恰可识别视差错误模型对DCT变换前的残差块进行调整,以降低变换残差块的方差。第五章总结了本论文的研究成果和创新点,并对进一步研究的方向和任务进行了展望。