【摘 要】
:
多视角立体重建是机器视觉领域重要且基础的研究课题,在测绘、工程建设、自动驾驶等众多领域有着广泛应用,蕴含着巨大的经济价值。随着社会的快速发展,各领域对多视角立体重建的要求也不断提升,而现有的多视角立体重建方法难以有效地对弱纹理、镜面与反射等重建困难区域进行建模。因此,如何提升多视角立体重建性能是一个亟待解决的问题。近年来,机器学习在众多视觉任务上表现出色,利用机器学习来提升多视角立体重建性能也成为
论文部分内容阅读
多视角立体重建是机器视觉领域重要且基础的研究课题,在测绘、工程建设、自动驾驶等众多领域有着广泛应用,蕴含着巨大的经济价值。随着社会的快速发展,各领域对多视角立体重建的要求也不断提升,而现有的多视角立体重建方法难以有效地对弱纹理、镜面与反射等重建困难区域进行建模。因此,如何提升多视角立体重建性能是一个亟待解决的问题。近年来,机器学习在众多视觉任务上表现出色,利用机器学习来提升多视角立体重建性能也成为了机器视觉领域的研究热点之一。然而,如何有效地将机器学习与多视角立体重建进行结合仍然是一个开放性问题,具有非常大的挑战性。为此,论文以深度图作为三维模型的主要表征方式,基于机器学习理论,提出了一套完整的包括相机优化、深度图估计、深度图补全与深度图过滤在内的多视角立体重建方案,主要研究工作与创新点包括:1)针对相机优化问题,提出了基于局部光束平差的相机优化方法。首先由粗至精地划分全局可视性图,以获取一系列规模适宜的局部可视性子图。然后挑选出各个局部可视性子图中可用于建模的核心相机群,并使用局部光束平差进行优化,以获取精度更高的相机参数。实验表明,提出的相机优化方法能够有效提升相机精度,并显著提升重建模型质量。2)针对深度图估计问题,提出了基于patch粒度匹配置信度学习的多视深度预测网络P-MVSNet。P-MVSNet首先基于均方误差计算像素粒度的匹配置信度,并通过patch粒度的匹配置信度学习模块来提升匹配准确度。然后基于混合的三维U-Net正则化匹配置信度空间,并使用深度上采样模块来获取更高分辨率的深度图。此外,为过滤噪声深度、提升深度估测质量,基于P-MVSNet的深度概率分布空间提出了深度置信度准则;基于多视几何一致性与深度一致性优先的深度挑选策略提出了深度一致性准则。实验表明,提出的P-MVSNet可以较好地对弱纹理、反射等重建困难区域进行建模,并在DTU与Tanks and Temples等多个评测数据集上达到了当时最先进的建模性能。3)针对深度图估计问题,进一步提出了注意力感知的多视深度预测网络Att MVS。Att MVS首先基于注意力感知的像素一致性测度来构建注意力强化的匹配置信度空间,然后通过自底向上的注意力引导的正则化方案来获取目标场景深度,最后引入了梯度损失函数来提升模型学习能力。此外,为提升基准数据质量,进一步提出了基于双模态深度对齐的基准深度图过滤算法。实验表明,提出的Att MVS可以进一步提升弱纹理、反射等重建困难区域的建模质量,并在DTU与Tanks and Temples等多个评测数据集上实现了当时最先进的重建性能。4)针对深度图补全问题,提出了一个新型的基于无监督学习的单张深度图补全框架USDC与双头的深度预测网络DHDepth。USDC仅需稀疏深度图与参考图像信息即可完成深度补全,且不存在域偏移问题。DHDepth则分别编码参考图像的颜色与像素位置信息来充分地理解目标场景的深层语义特征与空间位置特征,从而更好地估测待补全区域的场景深度。此外,为提升DHDepth学习效率,并降低计算资源消耗,进一步提出了基于patch的稀疏深度图重采样算法。实验表明,基于DHDepth的USDC不仅可以在标准的单视深度补全任务上媲美先进的基于监督学习的单视深度补全方法,还可以无缝嵌入基于深度图的多视角立体重建系统,并显著提升弱纹理、反射等重建困难区域的建模质量。
其他文献
时序数据是指在一定时间范围内以给定采样频率对某些事物或现象进行观测所记录的数据,时序数据分类对这些数据所描述的事物或现象的状态进行判断,在设备故障诊断、人类活动识别、医疗辅助诊断等领域应用范围广泛。随着物联网技术的发展,不同应用领域内多种多样的时序数据呈爆发式增长,各种应用对分类性能的要求越来越高,传统的以特征相似性判定为核心的时序数据分类方法无法满足相应要求。随着人工智能技术的发展,与深度学习相
肾细胞癌(Renal Cell Carcinoma,RCC),也称之为肾癌,是泌尿系统中的高发肿瘤,在人群中的发病率持续升高。早期局限性肾癌外科手术治疗效果良好,可以达到治愈的目的,而晚期肾癌目前还缺乏有效的治疗手段。虽然目前靶向药物对晚期肾癌有一定的治疗效果,但是价格昂贵,副作用大,且极易产生耐药。因此对肾癌进展和靶向药物耐药的研究具有重要意义。磷酸烯醇丙酮酸羧激酶2(PCK2)是细胞内糖异生关
非晶态材料处于非平衡态,弛豫是其本质特征,弛豫行为决定了非晶态材料的基本特征和应用,因此非晶态材料的研究也是围绕着弛豫的研究而进行。近些年,金属玻璃因其简单的原子结构和独特的性能,在科学研究和工程应用上发挥着越来越重要的作用。虽然金属玻璃在结构上相比于其它非晶态材料要简单得多,但其弛豫行为的复杂性丝毫不亚于其它非晶态材料。近些年的研究成果表明,金属玻璃中的弛豫行为与其结构和性能有着重要联系,但它们
叶轮机械复杂三维非定常粘性流动的实验测量、数值计算及相关分离流动的控制是本学科主要研究方向。拓宽整机稳定运行区间,使其在限制环境或非设计工况下安静、高效运行,则是近年来叶轮机械相关产品设计优化过程中的热点问题,而深入理解叶轮内外流动状态及其随工况的演变规律则是其中关键。本文以国家重点研发计划项目课题为依托,选用市场上应用量大面广的某高端家电产品用多翼离心风机为模型,结合先进测量技术及计算流体力学(
第一部分单细胞测序确定人主动脉瓣膜细胞组分目的:获取人主动脉组织并分离组织细胞进行单细胞测序以鉴定组织中细胞类型。方法:经华中科技大学同济医学院伦理委员会批准,收取临床诊断为非瓣膜疾病需行心脏移植手术患者受体心脏主动脉瓣膜及诊断为CAVD需行主动脉瓣置换手术患者病变主动脉瓣膜。经超声、手术医师及病理检测联合诊断后,将组织样本分为对照低龄组、对照高龄组以及钙化病变组。组织样本经过物理剪碎和消化酶分散
相比于传统固体激光器,光纤激光器因其激光效率高、易于热管理、光束质量好、结构紧凑、不易受外部环境影响等优势,近年来已经成为国际研究热点,并得到了飞速发展。工作在人眼安全波段范围内的掺铥光纤激光器在国防军事、航天航空、生物医疗、材料加工等领域有着广泛的应用前景,同时也是中红外超连续谱光源、光参量振荡器、掺钬光纤激光器的良好泵源。然而,与国外相比,国内高功率掺铥光纤激光器的发展相对较慢,且掺铥光纤长期
近年来,随着智能机器人技术的迅猛发展,微型化的无人机已经融入人们的日常生活。状态估计是支持无人机智能应用的关键技术之一。目前,以光学传感为主的室内微型无人机状态估计依然面临着环境多样性的挑战,易受到光照、纹理、烟雾等环境因素的干扰。为此,本论文提出以无线信号为环境感知媒介的新型轻量级状态估计技术。较大波长的无线信号能够绕射、反射、穿透障碍物,不受光学条件限制,能提高状态估计的鲁棒性。融合无线信号感
在切削加工过程中,切削温度及其分布直接影响着工件的加工质量以及刀具的使用寿命,但由于狭小的切削区域存在着恶劣的切削环境(大应变/应力、陡峭的温度梯度),使得现有的测温手段很难接近切削区域并实现切削区域的原位温度测量。因此,开发以高时空分辨率、测温准确及原位测量为目标的切削测温方法成为了现阶段亟待解决的关键难题。本文针对切削温度所面临的共性问题,开发了切削区域的原位温度测量方法,并围绕切削温度对刀具
背景与目的:三阴型乳腺癌(triple-negative breast cancer,TNBC)是一种具有高度侵袭性和异质性的恶性肿瘤,在时间上或方法上采取不当的干预都可能导致不良的预后。细胞周期是细胞复制和发挥功能必不可少的复杂序列事件,其畸变已被认为是癌症发生的标志之一。目前周期素依赖性蛋白激酶(cyclin dependent kinase,CDK)4/6抑制剂palbociclib(PD)
压电执行器能够提供快速和超高精度的机械位移,在微电子、光电子、航空航天和精密制造等领域发挥了不可替代的作用。但由于内部结构因素,压电陶瓷的应变存在迟滞(Hysteresis)和非线性。位移变化由于跟不上输入电压的变化产生滞后,从而限制了压电执行器的精度和速度。商业化PZT陶瓷执行器的应变迟滞通常在10%–15%之间。针对以上的问题,本文制备了压电执行器用织构化(1-x)Pb(Mg1/2Nb2/3)