论文部分内容阅读
自二十世纪四十年代以来,地点检索算法引起了国内外研究者的广泛关注。近年来,由于卷积神经网络强大的特征表达能力以及学习能力,人们逐步认识到在地点检索算法中利用卷积神经网络提取特征是可行而且是必要的。与此同时,三维激光信息被广泛使用于智能驾驶领域,且基于三维激光的地点检索算法已取得较好的性能。但是三维激光地点检索算法易受天气因素的干扰,视觉地点检索算法易受光照变化的影响。因此,将三维激光与视觉信息融入地点检索算法中,将有助于地点检索算法克服上述环境变化因素的影响。本文的主要研究工作如下:(1)针对NetVLAD算法将所有输入的局部特征都进行编码,导致输出的全局向量无法排除弱分辨力特征干扰的问题,本文提出一种改进的NetVLAD算法——MarginNetVLAD。MarginNetVLAD算法相对NetVLAD算法包含了多余聚点,这些聚点通过本文提出的改进的损失函数——余量懒惰四元损失函数,来捕获弱分辨力的局部特征,使得最终生成的全局向量有效去除这些弱分辨力特征的影响。(2)针对常用于地点检索算法的损失函数存在的各种问题,本文提出三种新的损失函数改进方案,并用实验证明了本文提出的损失函数相较常用损失函数应用于地点检索算法上的优势。此外,本文将提出的MarginNetVLAD算法应用于视觉地点检索以及三维激光地点检索算法中,实验结果表明基于MarginNetVLAD的地点检索算法相对于基于NetVLAD的地点检索算法以及其他传统地点检索算法在性能上有较好提升。(3)针对视觉地点检索算法对光照变化鲁棒性较差以及三维激光地点检索算法对雨天等天气变化鲁棒性较差的问题,本文基于MarginNetVLAD提出了四种基于神经网络的三维激光与视觉信息融合的地点检索算法。其中针对带权重表层融合方式,对余量懒惰四元损失函数进行改进,提出一种二级检索策略。实验结果表明带权重的表面融合模型相较于其他传统地点检索算法的优越性,其返回候选帧数量为1的检索召回率高于NetVLAD算法14.07%,高于PointNetVLAD算法18.01%。同时,对比实验表明带权重表层融合模型比其他单一信息地点检索算法具有更高的对环境因素变化的鲁棒性。此外,本文用两个数据集对本文提出的算法进行评估,验证了其算法的泛化性。最后本文分析了各个参数对带权重表层融合模型性能的影响,并评估了本文提出的模型的算法复杂度。