论文部分内容阅读
地图是人类理解世界的重要工具,它不仅描绘了环境的地理地形,而且能够用于任务规划。随着移动机器人被广泛地应用到人类的生产生活中,机器人要理解环境同样离不开地图。同时定位与地图创建是移动机器人理解未知环境的关键技术,机器人通过自身搭载的传感器,在运动的过程中估计自身的位姿,同时创建环境的地图。视觉SLAM(Simultaneous Localization and Mapping),由于相机成本低、图像信息丰富、技术难度大等原因,近几年受到了广泛地关注和研究。本文提出了一种用于视觉SLAM的半稠密认知地图创建方法,利用视觉SLAM获取的位姿信息,不仅能估计出环境的较稠密的逆深度信息,而且能识别出环境中的感兴趣物体。本文的主要研究工作包括:1)基于深度滤波器实现地图点的逆深度估计,从像素层面估计逆深度。在关键帧中选取合适的地图点,采用一种“粗糙-精确”的匹配方式在参考帧中观测并更新地图点的逆深度估计。根据逆深度估计表示方法,提出一种关键帧选取策略。2)基于图像金字塔实现关键帧的逆深度图估计,从图像层面估计逆深度,主要包括逆深度图更新和逆深度图传递。在估计的过程中,并行地估计关键帧图像金字塔每一层的逆深度图;在估计结束后,将金字塔的逆深度图自上而下地传递到最底层。3)基于Mask R-CNN(Region-based Convolutional Neural Network)实现感兴趣物体的三维识别。将关键帧图像识别结果转换为一种特定形式的图像作为环境认知信息,同时使用一种新颖的地图表示方式融合关键帧的位姿、图像、逆深度、误差方差和物体识别等信息。4)设计并实现一套完整的用于视觉SLAM的半稠密认知地图创建系统,系统主要包括系统启动模块、逆深度图估计模块和地图模块。地图的“半稠密”在逆深度图估计模块中实现,地图的“认知”在地图模块中实现,并通过地图模块融为一体。实验结果表明,本文提出的用于视觉SLAM的半稠密认知地图创建方法能够较准确地估计关键帧的逆深度图并较完整地识别出关键帧中的感兴趣物体;本文提出的地图表示方式能够有效地融合关键帧的各种信息,其转换得到的半稠密认知点云地图不仅能准确地还原环境而且能标识出环境中的感兴趣的物体。