论文部分内容阅读
随着网络和多媒体技术的不断发展,人们对于视频编码的要求也越来越高,一方面要求视频编码技术具有很好的压缩效果,另一方面还要求它具有不间断的传输能力。这就需要设计出一个可以产生分层压缩码流的编码器,对不同层次码流的解码可以获得不同质量的视频图像,所以,视频可分级编码技术应运而生。早期提出的可分级编码技术只能粗糙地实现可分级的能力,后来的学者们又提出了基于H.264的精细可分级视频编码技术,虽然该技术精确地实现了可分级的能力,很好地适应了网络带宽的波动性,却大大降低了编码效率。为了提高编码效率,本文首先引入了增强基本层算法,即将增强层解码后的信息引入到基本层,重建高质量的基本层参考图像,从而提高基本层以及增强层的编码效率,但在低码率的情况下极易引起预测漂移,针对这一问题,本文采用了自适应的前端网络估计算法,自适应地确定可以正确传输位平面的个数,解决了预测漂移的问题,很好地适应了网络带宽的波动性。由于视频图像最终是以人眼为归宿的,因此,在前面所做研究的基础上,提出了三种以改善主观视觉效果为目的编码方案,即基于OpenCV运动对象跟踪的FGS视频编码方案、基于粒子滤波目标跟踪的FGS视频编码方案和基于增强层残差系数重排的FGS视频编码方案。第一种方案利用OpenCV强大的库文件和开放的源代码自适应地跟踪视频图像中所有运动的对象,并将其定义为感兴趣的区域优先编码,虽然在一定程度上改善了视频图像的质量且计算复杂度低,但由于只是粗略地定义出运动对象的范围,所以对于运动剧烈,运动对象多的视频序列来说效果并不明显;第二种方案可以人为地定义出感兴趣的运动对象,而且粒子滤波跟踪效果很好,明显地改善了解码后感兴趣区域的图像质量,但计算复杂度很高;第三种方案将增强层的低频DCT残差系数优先编码,由于DCT系数重排以后,大大减少了需要编码的宏块,这就降低了计算复杂度,同时低频DCT系数是人眼感兴趣的部分,因此也提高了视频图像的主观视觉效果。