论文部分内容阅读
视频多目标跟踪(Visual Multiple Object Tracking,VMOT)是在视频序列中同时跟踪多个目标,并将不同时刻的同一目标进行关联,形成目标的运动轨迹的过程。随着检测技术的不断发展,基于检测的多目标跟踪算法受到了广泛的关注,已广泛应用于多个领域。复杂背景和高频率遮挡情况下,如何实现对多个目标进行高速有效地跟踪,仍是一个值得挑战的问题。为此,本文针对视频场景中行人多目标跟踪中的数据关联、轨迹关联等几个关键问题进行深入研究。主要研究内容如下:针对单一摄像机多目标跟踪中的目标遮挡和背景干扰等不确定性问题,提出了一种基于最大熵直觉模糊聚类的视频多目标跟踪算法。在该算法中,首先计算目标与每个观测之间的多个特征的相似度,然后利用基于邻域粗糙集的特征约简算法进行特征选取,去除冗余特征,选择对目标关联更有力的特征进行融合,得到目标与观测之间的距离函数,并引入目标与观测的局部信息,再利用最大熵直觉聚类得到的优化后的直觉模糊隶属度来构建目标与观测的关联矩阵,实现目标与观测的关联,最后对卡尔曼滤波器对关联上的目标、没有关联上的目标和没有关联上的观测分别进行滤波及预测。实验结果验证了提出的算法可以在目标之间相互遮挡和背景干扰时,对多个目标进行持续有效的跟踪,具有较强的鲁棒性和准确性,其在多目标跟踪准确度和漏检数的性能优于现有的大部分算法。针对高频率遮挡下目标轨迹中断以及虚假观测问题,提出了一种基于轨迹置信度的模糊轨迹关联算法。在该算法中,首先定义轨迹片段的相似度和目标轨迹置信度,并利用阈值将轨迹分成高置信度目标轨迹和低置信度目标轨迹,然后优先让高置信度目标轨迹与观测关联,利用得到的关联结果,再对低置信度目标轨迹进行互联判断。同时为了减少虚假观测对关联的影响,提出了新的轨迹起始原则和轨迹终止原则。实验结果表明,提出的算法可以将中断的目标轨迹连接成完整的目标轨迹,有效地减少目标标签变化数,提高了多目标跟踪的准确度。