论文部分内容阅读
随着计算机领域及人工智能的快速发展,智能化的信息产品取得了越来越广泛的应用。而人口老龄化越来越严重,人力成本越来越高,使得社会对服务机器人的需求越来越迫切。机器人视觉技术是机器人领域的一个重要研究方向,行人检测与跟踪技术作为人机交互的重要组成部分,已成为服务机器人视觉技术的重要分支。在不需要人为干预的情况下,计算机通过强大的数据处理功能来感知外界客观环境,对视频图像序列进行解算、分析与处理,可实现对外界环境中目标的检测、跟踪、定位与识别,并在此基础上试图对目标的行为进行理解,并对不同的任务采取不同的解决方案。行人的检测与跟踪作为一项基本功能,可以为上层规划提供很大的便利性,使人们从繁重的、重复单调的任务中解放出来。视觉感知体系是种信息量较多的体系,图像信息中包括许多信息特征,为了寻找有效的数据特征,往往要运用繁琐的算法或者耗费大量时间来进行计算。因此准确实时地检测并跟踪行人是服务机器人进行人机交互领域的热点与重要研究方向,同时也是一个具有重大挑战性的课题。本文在现有理论及文献的基础上,针对服务机器人的图像信息感知体系,深入分析了可以运用于实际场合的行人检测与跟踪算法,研究了深度图像下人体目标的提取方法。在行人受光照干扰,遮挡及动态背景下,仍然可以实现实时有效的跟踪。本文的主要研究工作包括:(1)基于深度图像的目标人体提取本文采用集成于Turtlebot上的Kinect传感器来得到目标行人的深度数据信息。通过对图像采集设备进行分析,了解相关软件及技术原理,对深度图像信息进行处理后便可提取出目标区域,解决了跟踪过程中目标行人位置初始化问题。由于Kinect传感器是基于红外线进行测距的,所以在较暗的环境中也可以将目标行人提取出来,对光线变化有很好的适应性。(2)对Tracking-Learning-Detection(TLD)跟踪框架的改进及算法对比基于TLD框架的目标跟踪算法能够通过在线学习的方式不断训练分类器并能实时更新正负样本,从而获得新的目标外观特征,具有良好的准确性和鲁棒性,即便产生缺帧现象或摄像头快速运动时仍可实现长时间有效跟踪。但此算法不能自动锁定跟踪目标,目标遮挡严重时也容易造成目标丢失或误跟踪。针对该问题,本文在基于深度图像目标提取的基础上,通过融合粒子滤波的优势来对TLD算法进行改进,实现更精确的跟踪定位。并用实验证明,当行人重现后,该算法比原始跟踪算法更快地实现目标重检。最后对各算法跟踪精度与跟踪实时性等方面进行了对比与讨论,进一步证明了本文算法的鲁棒性。