论文部分内容阅读
随着大容量存储设备、高速通信网络和高性能计算技术的快速发展,交互式视觉媒体通信越来越普及,人们对视频体验质量的要求也越来越高。但是视频的数据量通常很大,其增长速度远远大于网络带宽扩张的速度。因此,视频的高效编码必不可少,即在有限的带宽条件下为用户提供更高质量的视觉体验。率失真优化(Rate Distortion Optimization,RDO)是视频编码中提高编码性能的主要方法之一。在H.265/HEVC标准中,误差平方和(Sum of Squared Error,SSE)作为RDO过程中的失真测度。数据的保真度是指原始视频和重建视频像素值的相似程度,研究表明SSE或峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)能够较好地衡量数据的保真度。现有的针对人类视觉特征的研究表明,视频的主观质量与数据的保真度并不完全一致,SSE作为失真测度可以较好地衡量数据保真度,但未能完全保障更好的视觉效果。很多研究者因此提出了基于视觉感知质量的视频编码方法。但这些方法仅提高视频的视觉感知质量,却忽略了数据的保真度。由于结构相似性(Structural Similarity Index,SSIM)与人眼主观较为一致,本文根据视频内容的局部纹理特点,提出了基于SSE和SSIM混合失真测度的RDO编码方法,以期在提高视觉感知质量的同时,保障视频数据的保真度。实验结果表明,在全帧内(All Intra,AI)、随机接入(Random Access,RA)、低延时(Low Delay,LD)配置下,与 H.265/HEVC 的测试软件HM-16.14相比,本文提出的方法具有更好的主观视觉质量。与仅采用SSIM失真测度的方法相比,提出的方法可以有效保证数据的保真度。具体地说,在重建视频的SSIM相同时,与HM-16.14相比,提出方法的编码码率平均下降了2.919%(AI),3.182%(RA)和3.673%(LD);与仅采用SSIM失真测度的方法相比,提出方法的编码码率平均仅增加了 2.502%(AI),0.788%(RA)和-2.507%(LD)。若采用数据保真度PSNR衡量视频质量,在重建视频的PSNR相同时,与HM-16.14相比,提出方法的编码码率平均仅增加了 0.727%(AI),1.245%(RA)和1.768%(LD);与仅采用SSIM失真测度的方法相比,提出方法的编码码率则平均减少10.245%(AI),36.108%(RA)和 52.056%(LD)。进一步,在提出的混合失真测度的RDO编码算法基础上,本文提出了基于混合失真测度的码率控制算法。实验结果表明,在RA和LD编码配置下,与HM-16.14中采用的传统R-λ模型的码率控制算法相比,本文提出的方法具有更好的主观质量。具体地说,在重建视频的SSIM相同时,与HM-16.14中传统的R-λ模型的码率控制算法相比,提出方法的编码码率平均下降了 3.148%(RA)和3.594%(LD)。若采用数据保真度PSNR衡量视频质量,在重建视频的PSNR相同时,与HM-16.14中采用的传统R-λ模型的码率控制算法相比,提出方法的编码码率平均仅增加了1.237%(RA)和1.821%(LD)。提出的方法与HM-16.14中采用的传统R-λ模型的码率控制算法相比,具有相似的码率误差。