论文部分内容阅读
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是移动机器人、增强现实、自动驾驶等领域的基石,视觉SLAM是其重要的技术方案之一,也是计算机视觉领域十分热门的研究课题。视觉SLAM的目的在于同时完成传感器位姿的求解与地图的构建,其关键问题是如何根据鲁棒的视觉特征建立帧间数据关联,因此视觉特征的提取是视觉SLAM的关键问题之一,也是影响其性能的重要因素。本文对面向视觉SLAM系统的图像局部特征描述方法进行深入研究,设计用于提取图像局部特征描述子的深度神经网络,并且提出一个高效的使用深度特征描述子替换传统特征描述子的视觉SLAM系统。本文的主要工作和创新点如下:1、面向视觉SLAM这一特定应用场景,设计了高性能描述子提取网络。本文设计的描述子提取网络有三个特点,首先采用浅层卷积网络结构以减小计算量,保证提取过程的时间性能;其次对训练数据的采样策略进行改进,以使更多数据能够有效参与到模型训练中;最后优化损失函数,在传统三分支边界损失函数的基础上增加全局正交正则化项,以提高神经网络的预测能力。基于本文网络的图像局部特征描述子的鲁棒性和可区分性优于传统特征以及基于相同网络结构的其他深度特征,且提取过程耗时很短,可以达到GPU下的实时提取。2、面向采用深度特征作为描述子的视觉SLAM系统,提出了一种自适应阈值的FAST特征点检测与四叉树筛选相结合的均匀特征采样策略,并依此构建神经网络的训练数据集。均匀特征采样策略可以保证特征点在图像中均匀分布,这种均匀分布的特征点对于视觉SLAM系统有重要的促进作用。同时,由于本文使用深度特征描述子替换视觉SLAM系统中的传统描述子,为保持深度特征描述子模型的训练数据与应用场景的数据分布的一致性,需要使用基于同样的均匀特征采样策略的数据集训练模型,而已有数据集的构建方式均不符合这一需求。因此,本文基于HPatches图像序列,使用均匀特征采样策略生成约105个64 X 64像素大小的图像块数据用于深度特征描述子模型的训练。实验结果表明,基于本文所采用的均匀特征采样策略的深度特征描述子在视觉SLAM系统中表现超过基于传统数据集的深度特征描述子。3、基于本文设计的深度特征描述子,对视觉SLAM系统进行了改进。首先,使用深度描述子替换传统视觉SLAM中的图像局部特征描述子,据此构建帧间数据关联。其次,根据本文深度描述子的特点,调整特征匹配模块的匹配方式。最后,使用基于本文网络的深度描述子训练词典模型,用于视觉SLAM系统的重定位和回环检测等模块。选取经典视觉SLAM框架ORB-SLAM2进行研究与改进,改进后的系统比原系统有较大提升,最显著的提升是在EuRoC数据集的Difficult序列上,均方根误差指标平均提升31.6%。