论文部分内容阅读
随着计算机视觉技术的发展和对实际应用需求的扩展,运动目标的视觉跟踪技术越来越吸引国内外研究人员的关注,并广泛地应用于各个应用领域,如安全监测,机器人导航、智能交通和无人驾驶等。虽然,有关视觉跟踪的研究已经持续了好多年,但是各种噪声因素,包括背景杂波,遮挡,分散,光照变化在实践中依旧会出现问题,这些噪声因素使视觉跟踪变得更加具有挑战性。为了提高视觉跟踪的鲁棒性,减少跟踪误差率,本文提出了一种的生物激发框架——基于原目标检测的视觉跟踪。该方法在整个跟踪过程中同时评估了目标的状态和原目标的状态,所以性能更优越。本文的主要研究内容及成果如下:首先对给定的图像序列进行显著性检测,通常情况下,目标更可能会出现在高显著值的地方。本文采用在基于底层信息特征和对象级语义之间的表示方法进行显著性检测,结合了自底而上和自顶而下的注意力机制得到的显著图更接近人眼所能达到的提取程度。其次,进行原目标检测,本文采用基于分割算法和主题模型的原目标检测方法。比较多种分割方法后,本文选用了归一化分割算法,再利用概率潜在语义分析(PLSA)算法对分割区域进行类别估计,揭示出主题,从而检测出最终的原目标。接着,为了避免原目标检测过程中检测结果对分割结果的过度依赖,本文对PLSA模型进行改进,提出了一种基于多尺度的概率潜在语义分析方法(Multi-Level-probabilistic Latent Semantic Analysis,ML-PLSA)。该算法能综合多个尺度、多个方法的分割区域,根据这一综合结果提取出的原目标准确率更高。最后,在获得原目标空间信息的基础上,用贝叶斯算法对目标进行跟踪,在整个跟踪过程中,目标和原目标的状态被联合估计,因而目标相关性更加稳定。本文中,吉布斯抽样被用来优化跟踪算法,EM算法被用来揭示主题并通过最大似然概率优化主题分配,马尔科夫链在跟踪过程中可以推测目标和原目标的状态。通过实验证明,本文提出的方法能鲁棒地处理遮挡,分散和光照变化等问题,并且该方法在挑战一些复杂的视觉任务时,相比较于已有的方法更加卓越。