基于视觉显著性的立体视频编码研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:hzsbf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
立体视频是通过双视点或者多视点摄像机采集同一场景得到的视频序列,与单通道视频相比,它增加了景物的深度信息,可以增强视频的立体感和逼真感。但是立体视频庞大的数据量阻碍了其实用化,因此对立体视频数据进行高效的压缩以降低对存储和传输的需求至关重要。立体视频编码技术通常利用帧内、帧间和视点间预测与补偿等方法来挖掘立体视频的时间冗余、空间冗余和视点间冗余,从而实现一定的压缩,但是传统的立体视频编码方法忽略了人眼在观看视频时的感知冗余。本文从人眼的视觉特性出发,对基于视觉显著性的立体视频编码进行研究。基于人类视觉系统的生理学和心理学研究表明,人眼在观看和理解视频图像时,会将注意力集中在一些引起视觉显著性的、最能表现场景信息与图像内容、值得关注的区域,这些区域也就是感兴趣区域。根据人眼对不同区域的感兴趣程度不同和对失真的敏感度不同,本文利用视频的深度信息将视频分为多级感兴趣区域,并采取相应的量化参数调整措施为感兴趣区域分配较多的比特以提高视频质量,为非感兴趣区域分配较少的比特以实现更有效的压缩。基于多级感兴趣区域的多视点视频编码方法,提高了视频感兴趣区域边界的平滑性,在保证重建视频整体质量的前提下降低了码率,提高了多视点视频的编码效率。多视点视频可以让用户在不同视点间自由切换、增强3D视觉体验,但是在资源有限的环境中难以传输多个视点。虚拟视点绘制技术可以利用纹理和深度数据生成立体显示设备所需的多视点视频。本文在分析虚拟视点绘制原理的基础上,研究了基于视觉显著性、面向虚拟视点绘制的多视点视频加深度编码,提出了基于深度、运动和深度边缘信息提取感兴趣区域的方法和纹理视频、深度视频的优化编码方法。实验结果表明,该优化编码方法可以在不增加编码比特的情况下提升虚拟视点中感兴趣区域的质量。
其他文献
网络编码技术融合了路由和编码的概念,使网络节点不仅可以对数据分组进行存储转发,还可以进行编码处理。无线链路的不可靠性和物理层广播特性非常适合使用网络编码。目前已证明
关联成像,又称“鬼成像”、“量子成像”、“符合成像”。它的成像原理是在光路的一支放置物体,在接收端通过符合计数或强度关联探测,在另一支光路上获得物体的像。通常,放置物体
随着计算机技术的发展,同时数字图像传感器技术逐渐达到设计的极限,人们越来越倾向于通过数字图像处理的方式来满足日益增长的图像分辨率要求,图像的超分辨率技术就是通过数字图
随着TD-SCDMA通信技术的推广普及和煤炭企业信息化的发展,基于TD煤炭专网通信系统是一个提供语音业务、数据业务、实时监控调度业务的综合性通信服务平台,既解决了目前煤炭行业
目标识别是计算机视觉领域中的经典技术,它旨在将图像中的目标部分进行充分提取。图像增强算法作为该技术的核心支持算法,通常从频率域和空间域对图像的信息进行提取。然而,
完全没有经过压缩的图像,其中所包含的数据量是十分巨大的。因此,在对其进行进一步的处理之前,必须先将其压缩,因而,图像压缩是图像通信传输中的基础步骤。而变换编码又是图像压缩
高精度水下目标探测一直是水声信号处理中的重要课题之一。但由于海洋环境的复杂性,使得许多高分辨算法在实际工程应用中表现不佳。因此人们迫切需要一种稳健的高分辨算法。
在现代战争的复杂电磁环境下,电子侦察是电子战中的一项关键技术。无源目标侦察技术通过分析已截获的目标无线电信号,提取出有效的目标参数,如载波信息和调制信息等,进而提取出目
数字水印(Digital Watermarking)技术是将水印信息直接嵌入到数字载体当中,水印嵌入后不影响原载体图像的使用,也不容易被人的视觉系统所觉察。可逆水印技术是数字水印的一个