论文部分内容阅读
基于视觉的导航和三维重建是计算机视觉研究领域的重点。其中,基于立体视觉的视觉导航和三维重建比较成熟,其原理是利用双目或者多目摄像机的视差信息以及相机外参数从二维图像中恢复场景的三维坐标。基于立体视觉导航与三维重建技术的精度较高,对技术设备要求也较高,另外还有些不足之处,例如高精度图像配准,计算量大,成本高等。本文研究的是基于特征点匹配的单目视觉序列图像的相机运动估计和三维重建,算法的原理是根据单目摄像机的运动造成的图像视差恢复其运动信息,进而从二维图像中恢复出场景特征点的深度信息,且具有运算量较小,成本较低,较灵活等特点。本文主要从以下几个方面研究了基于单目视觉的三维重建:1.介绍了单应性矩阵的原理及其在视觉导航及三维重建中的重要性。2.研究了特征点检测及匹配算法,讨论了经典的Lucas-Kanade特征点跟踪算法,并在此基础上,针对道路图像提出了改进算法。3.研究了求解单应性矩阵的经典解法,并给出了RANSAC(随机抽样一致)方法的改进,使得求解单应性矩阵的精确性有所提高。4.恢复了单目视觉序列图像摄像机的实际运动参数,包括摄像机的旋转矩阵R和平移向量T,并在此基础上对两幅图像特征点的三维坐标进行还原。论文最后给出了基于图像序列的三维重建实验分析,并指出了单目视觉中三维重建中应注意的问题。论文中提出的各种方法和算法分别应用于模拟数据或真实图像数据。