基于视觉语义信息的室内停车场建图与定位方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cyzmie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高精度建图和定位是自主代客泊车系统的关键技术之一。在室内停车场环境下,车辆变动频繁,且存在行人干扰,这会导致据其生成的三维场景特征地图频繁更新,对计算资源要求较高。而且,全球导航卫星信号也因遮挡不可使用,这进一步增加了室内停车场低成本、高精度定位的实现难度。基于以上考虑,本文融合低成本的环视鱼眼相机信息、惯性测量单元和轮速编码器测量信息,设计了一种基于地面标志语义类别信息的高精度建图与定位方法,可以在室内停车场环境下实现实时的、鲁棒的高精度定位。本文高精度建图与定位系统主要包括建图、全局初始化与定位三部分内容,主要贡献如下:针对建图部分语义分割的误分割会影响地图精度的问题,本文设计了一种语义点云融合方法。该方法结合多帧观测结果对地图点的类别进行校正,可以减小分割噪声的影响。为了解决长时间局部位姿推算存在累积漂移的问题,本文提出了一种结合语义类别信息和视觉特征描述子的闭环检测方法,并配合子图匹配来验证闭环结果,可以提高闭环检测精度。针对全局位姿图优化难以保证点云一致性的问题,本文通过对全局位姿图优化的协方差矩阵进行设计,建立了全局一致的、精确的地面标志地图。通过在真实室内停车场场景下的实验,说明本文建图方法可以保证地图的精度和一致性。针对基于地面标志地图的全局初始化很难同时保证实时性和精度的问题,本文结合粒子滤波和语义信息描述子匹配,设计了快速且准确的全局初始化方法。该方法充分利用了粒子滤波算法精度高和描述子匹配速度快的优势,将描述子匹配结果整合到粒子滤波框架中,保证了粒子滤波全局初始化成功率的同时,提高了算法的计算效率。通过在真实室内停车场数据下的测试,说明了本文提出的快速全局初始化方法具有良好的实时性和初始化成功率。针对泊车过程对定位精度要求更高、且地面标志被遮挡时定位精度低的问题,本文提出一种结合语义和几何推理的点云匹配方法,提高了点云配准精度,并结合惯性测量单元和轮速计推理,通过分离协方差交叉滤波方法将多数据源输出的全局位姿融合,能输出更高鲁棒的全局定位结果。在真实室内停车场场景下的实验结果表明,本文提出的定位方法可以实时运行在嵌入式平台,其均方误差小于10厘米,可以满足室内停车场环境下自主泊车的定位需求。
其他文献
通常软件测试中大部分工作是耗时耗力,其中最代价最高的是错误的定位,而在错误定位上的技术改进能降低测试的工作负荷。目前程序错误定位的方法主要包含基于程序动静态切片,基于程序频谱的语句分析方法等。动态切片由于可以通过分析目标行变量在测试运行过程中的依赖关系,去除不影响目标行变量结果的语句,将关注点转移到相关程序语句以减少考察范围。而基于频谱的软件错误方法(SFL)源于聚类分析中的相似一致性原理,相似性
面部肌肉、神经损伤的患者会出现表情扭曲现象,严重影响了患者的日常生活。对于患者而言,长期定时前往医院进行康复状况检查,需花费大量时间金钱。并且患者面对医生时可能由于紧张、害怕等心理因素导致无法表现出最好的状态,使康复状况评估不够准确。对于医生而言,为病人评估康复状况属于重复性基础工作,占用大量门诊时间,减少接诊病人数量。另外,目前诊疗以医生主观判断为主,尚没有一套客观评价体系能够对病人训练效果进行
人体三维重建作为计算机视觉的一个子领域在最近几年发展迅速,其应用领域也愈发广泛。一方面,这项研究对人们日常生活和工作的方方面面都提供了非常多的帮助。另一方面,这项工作在科研领域也为计算机理解人体三维信息,认知三维世界提供了可能,是未来计算机视觉变革的前沿。为了解决现有的人体三维重建方法存在的耗时长,精度低等问题,本课题在已有的基于深度信息的人体三维点云重建算法的基础上提出了新的基于单目相机的人体稠
显著性检测是指通过模拟人的视觉特征提取图像中的显著区域,是计算机进一步理解和处理图像的重要预处理方式。关于显著性检测的研究已经有很多,但是关于人类视觉系统是如何捕捉到显著性区域尚未有明确的的解释。同时因为大量图像也蕴含着丰富的前后景信息,显著性检测仍然有很大的进步空间。特别是当图像包含一个复杂的场景,如何高效准确地将显著性物体提取出来仍然是一个待解决的问题。随着卷积神经网络的快速发展,显著性检测已
随着移动终端和定位技术的发展,服务端存储能力提升,越来越多的时空数据可以被精确地采集和存储,为基于时空数据的应用发展提供了坚实的基础。其中,轨迹数据是由移动物体产生的一系列时空数据,对于轨迹数据的分析和挖掘能够给人们日常的出行带来一系列便利,比如导航、路径推荐、智能交通等等。其中,对于轨迹数据的异常检测能够从海量的数据当中发现可能存在的异常行为,对于规范轨迹数据产生方的行为具有积极意义。目前,关于
在计算机视觉领域的诸多研究方向中,视觉目标检测与跟踪是最基础也是最重要的研究方向之一,同时也具有广泛的工业应用场景。视觉目标检测与跟踪是计算机对环境物体进行感知理解最基础也是最重要的步骤,为进一步的高层级的理解任务奠定了基础。而在众多的目标检测与跟踪的算法中,对目标的定位准确度是其算法整体性能的关键所在。针对视觉目标检测任务,本文着眼于目标定位准确度,通过分析检测结果,发现了当前的视觉目标检测算法
红外图像凭借其被动探测成像和全天候不间断工作的特性,在以科技对抗为主导的现代军事对抗中发挥着重要的作用。由于红外图像的广泛使用,一系列军事方面的红外图像目标检测问题成为科研人员们研究的热点之一。其中远方舰船、导弹、鱼雷等军事设备因为目标距离远、信号弱、小范围等固有属性,在红外成像系统中呈现出弱小目标的特性,该类目标的检测问题成为学者们在该领域长期关注的难题。高辐射的海杂波信号使得目标若隐若现,由于
随着人工智能技术的发展,表情识别的研究取得了突飞猛进的进展。大多数算法的良好表现依赖于训练集和测试集的分布一致性条件,但是诸如图像采集条件、个体属性等因素的不同会使得数据间存在较大的分布差异。因此当把模型应用到新的未知分布的数据上时,其识别精度会有一定程度的下降。跨数据集的表情识别问题具有重要的学术价值,该问题的解决有利于推动表情识别的广泛应用。现有的跨数据集的表情识别方法缺乏对干扰信息的有效排除
需求工程是设计和编写工业软件的关键步骤。以人工为主的需求建模方式非常耗时且容易出错,现有的需求建模方法大多需要人工来完成,或者根据完整的形式化或半形式化需求规范文本进行建模,仍然需要项目工程师事先花费大量的时间和精力,将系统需求完全理解并编辑成规范化的需求文本。因此需要一种自动化的方式可以在极短的时间内建立精确的需求模型。为了实现快速、准确的需求建模,且适用于智能制造领域的功能性与非功能性需求,本