论文部分内容阅读
随着信息技术的飞速发展,有关3D视觉的研究逐渐升温,3D视频信号成为未来多媒体通信的主要内容。多视角视频是使用多个摄像机在空间的不同位置从不同角度拍摄同一场景而得到的一组视频信号,是现阶段表征3D视频信号的重要方式。目前,它已被认为具有广泛的应用前景,可以应用于3D远程通信、自由视点电视,远程医疗,立体电影和虚拟现实等。
然而,多视角视频会带来视频数据的急剧增加,使得视频数据的存贮和传输变得十分困难,严重影响了它的应用,数据压缩成了该应用领域的重点研究课题。在多视角视频中,除了各个视频流内具有很强的空间和时间相关性,各视角之间也具有一定的相关性,因此,如何有效地利用这些相关性是提高多视角视频编码效率的关键。
论文首先介绍了多视角视频技术的应用及编码的基本方法,然后对基于H.264的多视角视频编码进行了分析,并对JMVM进行了阐述和介绍。论文基于对多视角视频编码的研究,统计分析了多视角视频中视差预测特性和各种相关性的相对大小,对多视角视频预测结构进行了研究和相关的测试,在JMVM预测结构的基础上提出了基于分层结构的视差预测框架,使码流获得了随机访问某一视角和部分视角解码的功能,从实验结果可以看出,这种预测结构也保持了较高的编码效率。最后根据多视角视频的特点,本文将全局运动估计引入到视差预测中,对多视角视频全局视差估计算法进行了相关的分析与研究,并与基于块的视差估计算法进行了比较,实验结果表明该算法能有效地改善视差预测效果,提高多视角视频的压缩性能。