沉浸式3D场景下的多视点视频增强算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:Andy_nnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的发展,多视点视频为用户带来不同于传统二维视频的浸入感与交互体验。这种用户体验与多视点视频的视点数量及图像质量息息相关。其中,多视点视频中的深度信息表示场景到成像平面的距离,是提供立体感的关键所在。而深度图像和彩色图像相比空间纹理较少、平滑区域较多,因此在传输时往往采用更高的压缩比,为深度图像带来不可逆的压缩失真,将影响终端用户的立体沉浸式体验。传统视频编解码器中的环路滤波没有发掘多视点视频间的相关性,使其针对低码率下的深度图像质量的提升十分有限。另一方面,受限于搭建稠密摄像机采集系统的高成本,一般采集到的多视点视频数目也十分有限。于是,为了给用户提供更好的自由视点体验,使用较少数量的参考视点进行其他任意多个视点图像的视点生成以及质量提升是十分必要的,即在视点数目上对多视点视频进行增强。其中,如何生成参考视点范围之外的未知区域图像,即视点外推仍是一个亟待解决的挑战性难题。上述这些问题,都为多视点视频的未来应用带来阻碍。本文针对上述挑战,根据多视点视频的特点,在多视点压缩深度图像质量增强与多视点外推两个方面展开研究,取得了一些进展,具体包括:(1)提出了一个自适应多模态残差网络进行多视点压缩深度图像质量增强;挖掘多视点视频中不同先验信息的相关性,设计了一个多视点残差网络,并在此基础上,构建一个自适应跳跃连接结构,从而充分利用不同先验信息中的有益信息,抑制误导性信息;为了更好地对提出的网络进行训练,制定更恰当的数据集构成与训练策略。实验表明,我们的算法在客观评估中实现比其他对比算法更高的图像质量提升。在主观评估中,压缩图像的块效应得到抑制,物体结构及细节得以恢复。我们还进行了验证三维(Three Dimensions,3D)建模精度的点云重建实验,在实验中,点云重建中不连续的物体表面得以恢复。(2)提出了一个多约束编解码网络进行参考视点外的多视点外推;设计了一个基于编解码模型的多视点深度学习网络对多视点视频进行特征提取并映射到一个高维分布,并在高维分布中融合特征重建图像,从而得到正确的视点映射;在这一基础上,提出一个包含像素约束、特征约束、边缘约束的多约束损失函数,更好地在缺少先验的视点遮挡区域生成合理的视觉信息。实验表明,我们的算法生成的图像在客观评估中达到比其他对比算法更高的图像质量。在主观评估中,生成的新视点图像能够减轻错误视点映射带来的伪影,而且参考视点外的空洞区域也能生成合理的图像。综上所述,本文在沉浸式3D场景下进行的多视点视频增强算法研究,可以有效提升压缩多视点深度图像的质量,增加多视点视频视点数量,以较低码率,实现较好的视觉沉浸感,为将来的3D视觉应用提供解决方案。
其他文献
酒精性肝病(Alchoholic liver disease,ALD)是全球发生率最高的肝脏疾病之一,系因长期饮酒或急性摄入过量酒精导致的急、慢性肝脏损伤,包括单纯的肝脏脂肪变性、肝炎、肝硬化,直至早期肝癌。酒精性肝病机制复杂且治疗方法非常有限。前期基于人群、动物模型、细胞模型的研究已发现部分基因及通路参与调控酒精性肝病的发生与发展过程。如全基因组关联研究(Genome wide associat
最近转角石墨烯中的Moiré平带受到了广泛关注。实际上,这种Moiré平带不仅存在于转角石墨烯系统,在多层石墨烯/氮化硼异质结中也普遍出现。当石墨烯放置在氮化硼上时,由于晶格的失配使得层间形成一个长程的Moiré条纹,Moiré条纹又会周期性的调制石墨烯狄拉克点附近的能带结构,从而形成Moiré能带。研究发现,当施加合适的垂直电场时,多层石墨烯/氮化硼异质结的费米面附近会出现Moiré平带,且具有
偏振光探测器由于在光学雷达,遥感,安全监控,激光偏振传感器等实际应用中具有显著优势而受到了广泛关注。最近,各向异性二维材料由于对线性偏振光具有本征的敏感性,并且与硅半导体工艺具有较好的兼容性,在偏振光探测器中显示出了广阔的应用前景。但是,大多数报道的各向异性二维材料仅限于具有简单晶体结构的二元材料,通常具有较低的各向异性。此外,由于缺乏有效的偏振光响应调控策略,偏振光探测器的研究进展受到了严重阻碍
近年来,随着高带宽业务的不断兴起,为满足用户日益增长的数据传输需求,骨干光网络正朝着大容量、动态可重构和透明化的方向不断发展。由于动态可重构、透明光网络的中间节点缺乏光-电-光再生功能,光信号在传输过程中受到的物理损伤将不断累积,导致光信号的传输质量(Quality of Transmission,QoT)不断劣化,在目的节点处无法满足业务要求。因此在部署一条新光路前,必须评估待部署光路的QoT以
纳米材料作为聚合物的增强相具有很大机械和物理性能增益的潜力,为了促进纳米增强聚合物复合材料的开发,必须建立合适的本构关系,以预测复合材料的整体机械性能随聚合物、纳米材料的分子结构的变化。本文以碳纳米管增强环氧树脂复合材料为研究对象,基于分子水平增强机理的理解,建立能够反映复合材料纳观结构与宏观响应关系的多尺度超弹性本构方程。运用分子动力学方法对本构方程中的未知参数进行识别,通过实验与理论计算的对比
本文针对由一个供应商和多个零售商组成的供应链系统,考虑主导型零售商开展促销活动、供应商分担部分促销成本的情形,研究了主导型零售商的公平偏好对不同销售模式下供应链成员的利润、定价、以及促销决策的影响。具体地,论文结合传统模式与代销直供模式,参考F-S模型,分别构建了考虑公平中性、零售商纵向公平偏好、以及零售商横向公平偏好的一对多供应链模型,将不同模型下供应链成员的最优决策与利润进行比较分析,并针对横
负重步行是人类日常活动中最为常见的运动,利用外骨骼对负重步行中的下肢进行助力,能够节省人体运动的代谢能耗。本文进行了下肢生物力学建模与计算,来量化髋、膝和踝关节的生物力学特征,研究踝关节外骨骼通用型辅助策略来降低步行代谢,分析得到了个体间的助力差异性,据此探索个性化的踝关节外骨骼助力策略,进一步优化了外骨骼助力效果,最后在实验平台上验证了通用型和个性化的踝关节外骨骼助力策略。论文的研究为负重步行下
傅克反应是合成芳香族衍生物的基本方法之一,被广泛应用于医药、农药、染料、香料、高分子材料等领域。科学家们对于该反应体系进行了持续不断的优化与拓展,反应体系中催化剂的当量不断降低,溶剂从污染大的溶剂(如苯、二氯甲烷)变成水或者醇溶液,体系变得越来越温和。大多傅克反应的策略局限于富电子底物,底物通常为卤代烃和酰氯,反应结束会带来环境的污染和后处理的困难。随着社会发展和科学水平的提高,人们对于有机化学的
装箱问题(Bin Packing Problem,BPP)是一类经典的组合优化问题,旨在将一定数量的尺寸相等或不相等的物品无重叠地放置在容器内。其中,容器可以是矩形、正方形、圆形或多边形,物品多为矩形或圆形。作为运筹学的重要分支,装箱问题在物流行业、圆形切割、集装箱装载、钢铁制造、圆筒包装等领域有着广泛的应用。同时,BPP已被证明是一个NP难问题,没有确定性算法可以在多项式时间内找到精确解,除非P
反射镜由于加工技术成熟、成像质量高等优点,是光学系统中最基本的光学元件之一。针对红外跟踪光学系统中用到的环形抛物面反射镜,本项目研制了一款能够对其焦距、焦平面光斑半径和偏心角这三个参数同时进行精确测量的测量系统,用以综合评判反射镜的质量,对反射镜加工技术的改进提供支持。本论文主要完成测量系统中的软件设计与开发、系统调试、综合改进等内容,目前该系统已经成功应用于生产现场。本论文对抛物面反射镜各项参数