三维深度图像的多描述编码

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:BenBenBenBen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维立体视频是一种能够提供立体感的新型视频技术,因其具有强烈的临场感而受到了人们的喜爱,目前最受欢迎的三维视频格式是多视点视频加深度形式的视频,这种格式视频压缩编码的重要组成部分就是深度图像视频的压缩编码。三维深度图像有其独特的构成特征,传统的二维图像视频的编码方法已经不适用于深度图像,寻求针对深度图像的编码方案十分必要。此外,由于人类视觉系统(Human Vision System, HVS)固有的视觉特性可以忽略大量的感知冗余,如果在视频图像编码中引入人类视觉系统的视觉特性,将会得到更好的视觉效果。本文在传统的格型矢量量化多描述编码框架下,根据深度图像的特点以及人眼的视觉特性,对深度图像的编码算法进行研究和改进。主要完成的工作包括:(1)提出了基于格型矢量量化的多描述深度图像优化编码方案。考虑到深度图像具有很强的稀疏性的结构特征,我们对经典的格型矢量量化多描述编码方案进行了改善,方案中将边缘信息在相应块中所占比例的多少作为量化步长自适应分配的准则,对边缘信息多的块分配较小的量化步长,这样可以使边缘部分实现更精确的编码,最终使得重构深度图像以及合成虚拟视点的质量得到提升。(2)提出了包括深度信息在内的JND模型SDJND.传统的单视点图像视频编码考虑了空间域的JND模型,但是人类视觉系统对深度信息的改变也存在着感知冗余。本方案将空间域和深度域的JND模型进行结合得到新的JND模型,即SDJND模型。该模型不仅考虑了空间域的掩藏效应,而且还考虑了深度图像的视觉冗余,与未考虑深度信息的空间域SJND模型相比,SDJND模型能够更好地吻合人眼视觉特性。(3)提出了基于人类视觉系统的深度图像多描述编码方法。将从SDJND模型中提取出的DJND模型应用于三维视频深度图像编码系统中,根据重建深度图像和原始深度图像的差值在DJND范围内的百分比来自适应分配格型矢量量化的量化步长。在码率近似相同的情况下,该优化方案在客观质量和主观质量上都有较好提升。
其他文献
基于P2P技术的流媒体应用目前已经成为互联网中最主要的应用之一,各种P2P视频直播(live streaming)、点播(VoD)系统的大规模应用引起了研究人员的广泛关注。以PPLive为例,目
近年来,随着计算机视觉技术和图像采集技术的发展,以及CPU/GPU等相关硬件性能的不断提高,越来越多的计算机视觉技术被应用于工业生产和实际生活中。而随着人们生活水平的不断
较低的信息传输率一直是二进制脑-机接口系统所面临的一个潜在的问题,并严重限制了它在实际生活中的应用。目前提高信息传输率的最有效的方法之一是将二进制的脑.机接口系统
随着移动智能设备(如智能手机、PDA等)的大量普及,通过设备的移动带来机会式连接从而搭建起临时网络,使得在不具备通信基础设施的网络环境中设备间通信成为可能,但由于移动设
目前离散小波变换对数字图像进行处理,大都是采用行、列分离处理方式,其本质上是对纯二维信号的一维分离处理。图像编码国际标准JPEG2000采用Daubechies9/7、5/3小波用于有损和
广义低密度奇偶校验(generalized low-density parity-check, GLDPC)码是一类码率选择范围广、性能逼近香农限的迭代可译码。与标准低密度奇偶校验(low-density parity-check
OFDMA近年来吸引了大量的关注,目前它已经被IEEE MAN802.16d/e标准采纳为三种物理层模式中的一种。尽管OFDMA有许多的优点,设计一个OFDMA系统还面临着一些技术上的难题,其中一个
学位