论文部分内容阅读
随着多媒体和计算机的发展,三维重建技术目前广泛应用于电影特效、数字城市、数字博物馆、医学等领域。基于视觉的三维重建是使用摄像机获得物体或场景的二维图像,通过多视图几何的知识,并采用计算机视觉的相关技术得到物体的三维模型。基于视觉的三维重建是计算机视觉的一个十分重要的研究方向。为了对某张感兴趣物体或者场景的图像进行重建得到其三维模型,我们希望能够从图像库中检索出相似图像,获得更多的图像二维信息,然后再基于这些图像序列进行三维重建。在这个问题背景下,本文研究了联合二维信息的三维重建,该方法将图像检索和三维重建联合起来,为了在通过图像检索得到的图像序列中选择合适的图像以较小的代价得到较好的三维重建结果,本文还研究了图像的选取策略。论文完成的工作总结如下:(1)首先对图像检索进行了研究。在这个部分,本文采用了基于SIFT局部特征的图像检索。但是在提取SIFT特征时,对于不同的图像往往会提取到不同数量的局部特征,为了图像之间的高效比较,本文采用了基于SIFT特征的词袋(BOW)模型来获得更好的检索效果,并且研究讨论了曼哈顿距离、标准化欧氏距离、欧氏距离这三种度量方式,利用查准率和查全率对图像检索系统采用这三种距离度量时的性能进行了评估。(2)研究了图像的选取和基于图像序列的三维重建。在检索得到的图像序列中可能会存在信息冗余和误差,如果将这些图像序列全部加入进行三维重建会导致不好的重建结果,因此本文研究了基于匹配点和单应矩阵的图片选取策略,在图像序列中选取最合适的二维图像,以较小的误差得到效果较好的三维点云结果。本文采用了基于摄像机运动恢复结构(SFM)的方法对图像进行多视图三维重建。首先将图像检索得到的图像序列进行SIFT特征提取和匹配。然后研究了基础矩阵、本质矩阵和摄像机矩阵的估计问题。由于图像匹配中会产生错误的匹配点对,这些错误的匹配点会使基础矩阵的计算产生极大的误差,严重影响后续的三维重建。针对这个问题,本文研究了基于基础矩阵的RANSAC算法,利用这个算法对匹配点进行筛选并计算新的基础矩阵。然后利用线性三角法计算得到稀疏的三维点云,但是稀疏的点云一般是不可视的。因此,本文采用PMVS算法对稀疏点云进行稠密匹配,得到可视化的稠密点云。