论文部分内容阅读
近年来,人们对于娱乐生活的需求逐步提升,基于位置的服务也被越来越多的科研学者和公司关注,如智能推荐、导航、增强现实(Agumented Reality,AR)等,而如何确定用户位置是所有后续服务的基础。在室外,有成熟的全球定位系统(Global Positioning System,GPS)可以使用,但是在复杂多变的室内环境下,GPS定位精度不足,有时甚至会失效,因此多种新的室内定位技术被提出。随着摄像头在手机等终端设备和各种室内场景中的普及,用户完全可以通过拍摄的室内照片获得自身位置。同时,因为视觉定位具有高精度和无需布施额外设备等优点,基于视觉的室内定位算法成为很多室内应用的首选方案。本文以数字图像处理、深度学习、多视图几何及三维重建等理论为基础,将语义识别、同时定位与建图(Simultaneous Localization and Mapping,SLAM)技术与定位算法相结合。首先,本文讨论了 SLAM技术以及基于视觉的室内定位技术的国内外研究现状。其次,本文研究了视觉定位和SLAM技术的相关基础理论。此外,本文在数据库建立、图像匹配两个方面对传统算法的一些不足,进行了如下研究:(1)针对传统SLAM算法在动态环境下鲁棒性不高的问题,提出了一种融合语义与几何信息的SLAM算法。该方法先利用语义检测网络识别输入图像的语义信息,再利用多视图几何关系在语义区域检测出图像中的动态点,将剔除动态点后的匹配信息送入SLAM前端,同时在前端结合语义和几何信息来完成相邻相机间的位姿求解。仿真结果表明,该方法能够有效剔除动态物体的干扰,提高SLAM在定位任务中求解的相机位姿精度。(2)针对基于2D图像的视觉定位算法精度低、数据库容量大的缺点,以及基于3D模型的视觉定位算法低检索效率的缺点,提出了一种基于SLAM的视觉定位方法。离线阶段,结合待定位环境的2D图像与通过SLAM获取的三维稠密点云图建立离线数据库。在线阶段,利用两步匹配方法获得2D-3D匹配对,并基于此求解用户位置。仿真结果表明,该方法能够有效提高定位精度,同时,在保证小数据库容量的前提下提升定位效率。本文提出的基于SLAM的视觉室内定位算法具有广阔的应用前景。其中,融合语义和几何信息的SLAM算法能得到更高精度的相机位姿。同时,基于SLAM技术的离线数据库建立有效降低了传统算法数据库建立的时间开销,本文设计的定位算法能在保证离线数据库容量不大的前提下,有效提升定位精度和定位效率。