多视点视频编解码和虚拟视点合成技术的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hukuikui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视点视频是当前多媒体领域的研究热点,它是一种具有立体感和交互功能的视频序列,用户在观看时可以任意改变视点或者视角,以实现对同一场景进行多方位体验。本论文面向多视点视频的交互式应用,对影响视点交互时延的编解码技术以及虚拟视点合成技术进行了研究。   论文首先对多视点视频的时间相关性和视点间相关性进行测试统计,结果表明:对于大多数视频序列,时间相关性占主导地位。并由此提出了一种具有低时延随机访问性能的多视点视频编码结构。该编码结构确定中间视点为基本视点,并将视差补偿预测用于关键帧,而对非关键帧仅进行运动补偿预测编码。   其次,论文针对非关键帧的运动补偿预测编码,根据相邻视点间运动信息具有高度相关性的原理,提出一种基于自适应运动矢量精细的Motion skip模式,该模式可得到当前编码宏块更为精细的运动信息,从而提高了编码效率。   第三,在解码端,基于Motion Skip模式的特点,论文提出了一种单循环解码技术,即对参考视点中的关键帧进行完全解码,而对非关键帧只需进行解析得到运动信息用于解码当前帧,使参考视点中的所有非关键帧都不需要进行运动补偿,从而降低了视点切换时的时延。   最后,论文在JMVM模型的基础上添加一个虚拟视点合成模块,使用户交互请求时不需要增加辅助的视频流,直接使用联合编码后的码流进行虚拟视点合;将该虚拟视点合成模块与上述提出的编解码方案相结合,虚拟视点序列同样以GOP为单位,对其中的关键帧和非关键帧运用不同的合成技术,对关键帧采用基于深度的亚像素精度绘制技术,而对非关键帧则利用视频序列的时间相关性,进行基于运动补偿的绘制技术;最后针对图像遮挡问题进行讨论并提出解决方案。论文提出的基于JMVM的虚拟视点合成技术既保证合成虚拟视点的质量又提高了其可行性和时效性。
其他文献
由于量子信道存在噪声,不可避免地会对输入量子态产生影响,量子编码的目的就是为了纠正或防止错误的发生。虽然量子纠错编码和经典信息论中纠错编码思想相同,然而量子态的物理特
由于无线通信具有广播特性,信息很容易被窃听者窃取。安全通信是无线通信中非常重要的问题。本文与传统的研究安全通信的角度不同,而是从信息理论的角度来分析一个通信系统的安
近年来,随着计算机和因特网的普及,多媒体已经渗透到人们的生活当中,也成为当前计算机行业最热门的技术之一。多媒体技术和通讯技术的日益发展,使得多媒体娱乐、多媒体通信、数字
图像去噪是数字图像处理中的经典问题。各向异性扩散模型也称为P-M模型,是典型的基于偏微分方程的图像去噪方法。其思想是通过可以表征边缘的图像梯度来控制扩散平滑程度,因
数字电视发展至今,技术发展已经相当成熟,在全球范围内数字电视将毋庸置疑的取代模拟电视。在国内,数字电视更是在未来数年内将要完成全面覆盖。数字电视将成为信息产业最庞
近几年来,动漫产业呈现爆炸式的增长,卡通人物形象更是被创造性地应用在视频通话、角色游戏等方面,这些都离不开计算机辅助动画合成技术在降低工作量、提高表现效果方面发挥
近年来,随着通信技术以及高速网络的快速发展使得基于IP网络的多媒体应用(尤其是实时视频传输)变得越来越广泛。由于在Internet上传输数据时不可避免的会遇到网络拥塞、错误、
随着电网智能化的发展以及电气设备的普及,脉冲噪声对电力通信系统的影响变得日益严重。电力通信中脉冲噪声的研究越来越深入,但对脉冲噪声的抑制尚未形成有效处理机制。本文以IEEE 802.22无线区域网(WRAN)与IEEE 1901.2两种具有代表性的电力通信标准为背景,对脉冲噪声处理方法展开研究。IEEE 802.22与IEEE 1901.2物理层均采用正交频分复用(OFDM)作为调制方式,因此本文
下一代无线通信系统需要以较高的频谱效率为用户提供高速率、高质量的多媒体业务,一定条件下,MIMO技术可以在不增加额外带宽的同时,显著提高频谱效率,因而成为最具潜力的核心技术
随着科学技术的进步,移动多媒体通信在全球范围内得到了迅猛发展,人们对多媒体业务的需求也不断增长。如何显著提高移动通信系统中的频谱效率,以满足日益增长的通信容量的需求,成