论文部分内容阅读
视频目标跟踪是计算机视觉的一个重要研究方向,在增强现实、感知用户界面、视频监控、辅助驾驶等方面已经获得成功应用。其基本思想是根据视频信息在时间和空间上的相关性,确定每一帧图像中对象的方向和位置。视频目标跟踪的本质是估计视频中目标的运动轨迹,获得运动目标的实时位置、速度等信息为视觉理解做准备。理想的视觉跟踪算法具有鲁棒性、实时性等特点,以保证算法的实用性。另一方面,为保证跟踪精度和准确性,跟踪算法通常具有较大的运算复杂度,导致实时性较差,如何解决这一问题成为当前视频目标跟踪领域的热点。在众多的视频目标跟踪算法中,粒子滤波算法和均值漂移跟踪算法以其独特的优点受到了越来越多的关注。粒子滤波算法是一种适用于非线性非高斯环境的目标跟踪算法,具有跟踪精度高和适用范围广泛的显著优点,但由于该算法是一种基于采样的Monte Carlo方法,存在粒子退化和采样枯竭的问题,制约了其在视频目标跟踪中的性能。基于均值漂移的视频目标跟踪算法因其实时性和鲁棒性而成功应用于视觉跟踪领域,但在目标快速移动、目标背景存在突变的情况下,算法性能严重降低甚至失效。针对这些问题,本文从以下几个方面对视频目标跟踪方法展开了相关研究:首先详细分析介绍了扩展卡尔曼滤波、不敏卡尔曼滤波以及粒子滤波三种非线性视频跟踪算法的原理和具体流程,为后续研究工作奠定了理论基础。分析了粒子滤波算法中粒子退化现象的成因,针对传统的多项式重采样方法会引起粒子多样性的丧失、粒子枯竭和运算量较大的问题,提出了一种新的重采样方法——权重化点数重采样算法,并将其应用于视频目标跟踪的粒子滤波算法。该方法将总的样本区间以各个当前样本值(即重采样之前的粒子)为中心分成若干个小区间,在各个小区间里以正态分布抽样,每个区间里的抽样点数与该区间中心的样本值所占的权重成正比。仿真分析表明该算法的跟踪性能与传统算法相差无几,但运算量大大降低。针对传统的均值漂移跟踪算法在目标快速移动、方向突变时,算法的性能会大幅降低的问题,提出了一种基于当前统计模型的均值漂移跟踪算法。该方法首先应用当前统计模型对候选目标的运动特质进行建模,并预测目标的候选位置,然后使用均值漂移算法迭代更新目标的最优位置,并反馈给当前统计模型及其自适应跟踪器作为下一次的测量值。仿真实验表明,该方法迭代次数少、跟踪精度高、可靠性强,对高速机动目标有较好的跟踪效果。通过多种不同场景的实验分析验证了该算法的有效性。最后,对论文的研究工作进行了总结,并对下一步的研究进行了展望。