论文部分内容阅读
随着视频编码技术与显示技术的飞速发展,人们对于观影体验提出了更高的要求,因此,能够展现出三维立体效果的自由视点视频(Free Viewpoint Video,FVV)成为了当前的研究热点。国际电信联盟和国际标准化组织在2012年7月份成立了3D视频联合组(Joint Collaborative Team on 3D Video Coding,JCT-3V),负责进行基于HEVC(High Efficiency Video Coding)编码标准的三维视频扩展(3D-HEVC)项目的开发工作。基于HEVC编码标准的三维视频编码扩展,利用先进的HEVC编码标准对单视点纹理视频和深度图进行帧间、帧内编码;利用多视点纹理视频加深度图(Multiview Video and Depth,MVD)编码格式进行视点间编码和虚拟视点合成。因为HEVC编码标准对帧间、帧内编码等环节进行了优化,并且对MVD编码格式提出了视点间预测等概念,使得3D-HEVC编码标准具有高效的编码性能。尤其是在纹理视频和深度图的帧内预测部分,新增的33个预测方向模式和深度模型模式(Depth Modeling Mode,DMM)都提高了帧内编码准确度。但是,由于这些新编码工具的加入,造成了多视点纹理视频以及深度图帧内预测计算复杂度的大幅度提高。因此,本文针对这些问题,提出了两个有效的解决方法:一是利用Sobel边缘检测算子,通过与预测单元(Prediction Unit,PU)进行卷积以检测出PU内的边缘方向,根据检测出的方向来判断该PU的预测方向模式。该方法避免了复杂的率失真优化(Rate-Distortion Optimization,RDO)过程,从而完成了快速的纹理视频帧内预测模式判决,并在编码性能基本不变的情况下,节省了约39.6%的编码时间。二是将最大类间方差法应用于深度图的Wedgelet模式判决中。最大类间方差法能够在深度图PU中快速得到分割的判决阈值,进一步快速完成深度图PU的二值化。该方法取代了传统的DMM判决过程,从而降低了深度图帧内预测模式判决的计算复杂度,并在保持编码性能不变的情况下,节省了约35.5%的编码时间。本文提出的这两种快速算法,均能有效降低视频编码中帧内预测的计算复杂度,达到了预期的效果,促进了3D-HEVC编码标准的实时应用。