【摘 要】
:
随着计算机视觉技术的蓬勃发展,人们越来越不满足于仅通过计算机了解场景目标的二维信息,使用二维序列图像重建出目标主体的三维信息成为了越来越迫切的需求。如今,基于序列图像的三维重建技术已在多个领域发挥着不可替代的作用,然而该技术存在着无法兼顾重建精度与实时性的问题。本文主要关注序列图像三维重建的精度与实时性问题,从三维重建对输入序列图像的分辨率要求较高以及传统三维重建算法无法兼顾精度和实时性这两个问题
论文部分内容阅读
随着计算机视觉技术的蓬勃发展,人们越来越不满足于仅通过计算机了解场景目标的二维信息,使用二维序列图像重建出目标主体的三维信息成为了越来越迫切的需求。如今,基于序列图像的三维重建技术已在多个领域发挥着不可替代的作用,然而该技术存在着无法兼顾重建精度与实时性的问题。本文主要关注序列图像三维重建的精度与实时性问题,从三维重建对输入序列图像的分辨率要求较高以及传统三维重建算法无法兼顾精度和实时性这两个问题入手进行研究。首先,针对三维重建算法对输入序列图像分辨率要求较高,以及序列图像相邻图像之间存在大量相似纹理信息的特点,提出了一种基于通道注意力机制和神经纹理迁移的图像超分辨率重建网络CANTT(Image Super-Resolution by Channel attention and Neural Texture Transfer),通过实验证明了该网络相比几种经典的图像超分辨率重建网络能够得到纹理细节更加丰富且真实的重建图像,为后文基于序列图像的三维重建算法得到高精度的三维模型奠定了基础。其次,针对现有三维重建主流解决方案往往无法很好地兼顾实时性与准确性这个问题,提出了一种基于SIFT-GMS算法的图像特征匹配模型,并基于此模型设计了一个解决方案实现序列图像的三维重建。本文提出的图像匹配模型在保证重建精度的基础上,实现了良好的实时性。该模型在耗时仅为SIFT算法的34.6%,SURF算法74.1%的基础上,同时表现出不次于SIFT图像匹配模型的匹配效果,是一种能够兼顾实时性与准确性的算法。最后,将序列图像的相邻后一张图像作为前一张图像的参考图像,借助本文提出的CANTT网络提升图像的质量,然后使用超分辨率重建后的序列图像进行三维重建,以显著提升最终生成的三维模型精度,为如何提升基于图像的三维重建算法精度提供了一个切实可行的思路。
其他文献
航拍图像指使用航拍飞行器携带摄影设备,在空中对地面物体进行拍摄,从而得到的航拍目标信息,被广泛应用在地貌测绘、军事侦察等众多重要领域内。因此航拍图像的清晰度研究有着十分重要的现实意义。本文分别从依赖图像退化模型的传统算法和依赖神经网络模型的深度算法两个方面,对航拍图像中广泛存在的运动模糊问题展开研究。传统算法研究过程中:首先,结合航拍成像特点进行理论分析,估算航拍运动模糊核的像移长度和像移角度两个
计算关联成像作为一种新型的成像方式,具有传统成像不具备的抗干扰性强的特点,近年来在水下成像、遥感成像中发挥着其独特的作用。在散射介质下的计算关联成像中,如水下计算关联成像,测量矩阵对成像效率和成像结果的质量都至关重要。本文围绕存在散射介质的不同测量矩阵计算关联成像进行了研究,主要工作内容如下:1.通过比较散射介质中计算关联成像应用的不同的测量矩阵,研究了应用不同测量矩阵的成像速度和成像质量。通过选
三维点云配准是寻找两个或多个三维点云之间的最优空间变换关系,使其能够在空间中达到良好的匹配,它是计算机视觉、模式识别和智能机器人等领域的关键技术之一,具有重要的理论研究意义和实际应用价值。三维点云配准主要分为刚体配准和非刚体配准两大类,对于包含噪声、外点及数据缺失的点云非刚体配准算法研究仍是当前点云配准领域的一个热点和难点问题。针对包含噪声、外点及数据缺失的三维点云非刚体配准,本文在深入研究传统迭
视频超分辨率重建是一种根据低分辨率视频恢复高分辨率视频的技术。视频超分辨率技术是计算机视觉领域中的经典和热点研究内容之一。视频超分辨率重建旨在利用视频帧序列的时空相关性生成精度高,且感知质量好的高分辨率视频。本论文重点围绕基于深度学习方法提高视频的感知质量问题展开研究。在深入研究先进的基于深度学习的视频超分辨率方法的基础上,提出了一个新的光流补偿结合多特征鉴别生成对抗网络OFC-MFGAN,并将其
近年来,深度卷积神经网络(Deep Convolution Neural Networks,DCNN)在单幅图像超分辨率(Single Image Super-Resolution,SISR)中得到了广泛的应用。然而,大多数现有的基于DCNN的SISR方法往往会产生过于平滑的输出,对图像细节信息的恢复不够理想。为了解决上述问题,本文对基于小波变换和自注意力机制的图像超分辨率重建算法进行了相关研究,
在网络媒体时代,人们通过微博、短视频等社交平台对各类热点事件发表相关言论和看法,这些文本内容简短、表达幽默,能充分反映人们的内心情绪。挖掘这些短文本的潜在情感倾向性,分析和预测用户行为,可以为各个领域的舆情监管工作提供辅助支持。目前,面向网络短文本的情感分析算法研究已取得了一定的成果,但仍存在一些问题,例如,网络新词的不断涌现造成分词效果较差;短文本表现形式的复杂导致传统特征选择结果不佳;特征学习
MOOC平台课程评论文本中包含了大量学习者对某一门课程的看法,甚至是对授课教师和学习平台的看法。然而海量的评论数据使得教师或平台无法对每条评论及时阅读和处理。通过对MOOC课程评论进行情感分类和方面挖掘研究,能够了解学习者在学习过程中所关注的方面和对其产生的情感态度,有助于教师或平台改进教学方式和完善平台功能,从而调动学习者积极性,降低退课率。本文以MOOC课程评论文本为研究对象,针对情感分类和方
句子相似度计算是自然语言处理中广泛应用的技术,是句子语义理解的基础,能促进计算机对人类语言的深入理解。为了能准确地对句子进行相似度计算,本文首先提出一种能准确地对句子语义建模的句子表示方法,然后提出一种能高效地对句子之间的语义关系建模的句子匹配算法,最后在此基础上提出一种句子相似度计算方法。本文主要研究工作如下:(1)针对句子包含的空间信息的特征很难被准确提取的问题,提出了一种基于异构图的句子表示
眼眶淋巴瘤(Orbital Adnexal Lymphoma,OAL)和炎性假瘤(Idiopathic Orbital Inflammation,IOI)是眼眶最常见的两种淋巴组织增生性疾病。OAL是一种恶性眼眶肿瘤,发生率高达55%,其最佳治疗方法是局部放疗。IOI是一种特发性良性病变,约占眼眶疾病的10%,糖皮质激素治疗是目前公认首选的治疗方法。这两种疾病治疗方法的巨大不同使得区分二者极为迫切
古代文物具有丰富的文化内涵,由于自然灾害或人为因素,出土文物存在不同程度的缺损,影响了虚拟展示等后续工作。随着三维激光扫描技术的发展,三维数字化修复成为文物虚拟化修复领域的挑战性问题,对重现文物全貌具有重要意义。然而,为了提高修复效率首先会压缩文物模型,导致部分特征丢失。此外,复原的三维文物表面缺乏颜色纹理的信息。因此本文应用深度学习技术,分别从三维和二维的角度修复表面几何特征和纹理信息。主要研究