论文部分内容阅读
视觉目标跟踪作为计算机视觉领域的一个重要研究课题,在国防、视觉导航、视频监控与通信、人机交互、医疗诊断、以及智能交通等多个领域有着广泛的应用。其研究目的是使计算机能够模拟人类视觉的感知功能,并赋予机器辨识与理解视频中运动目标的能力,为更高层次的视觉任务提供重要的线索。由于受到现实环境中很多内在或外在因素的影响,设计一种鲁棒的跟踪算法十分具有挑战性。至今,随着很多热心学者的不断研究,其理论框架日益成熟。尽管跟踪技术相对成熟,但其在现实环境中应用仍然存在着一些待解决的难题。因此,研究目标跟踪不仅具有重要的理论意义,而且具有广泛的应用前景和很高的实用价值。本文专注研究基于线性回归模型的观测建模问题,尝试设计一种鲁棒视觉跟踪算法。论文主要贡献如下: 首先,本文在研究现有视觉跟踪算法的基础上,提出了一种基于多任务最小软阈值回归模型的跟踪算法(MLST)。该算法旨在增量地学习一种基于在线数据的特征子空间,用它来线性构造候选样本的外观模型,并将重构误差假设为独立同分布的高斯噪声和拉普拉斯噪声之和。同时,观测模型中采用一种多任务联合外观学习框架和可靠的似然度测度函数,使得跟踪器快速准确定位目标。此外,跟踪算法回归函数的参数优化中还采用了理论性较为严谨的多变量交替迭代优化算法ADMM,使得回归函数具有良好的收敛性能,从而提高观测模型的精度和跟踪算法的鲁棒性。 其次,本文在MLST算法基础上提出了一种基于在线复合模板模型表示的视觉目标跟踪算法(OIMRT)。该算法利用在线子空间学习方法和负特征实时扩充策略来构建一种复合模板来建立观测模型,且在其回归模型中设计合适的误差估计函数,以便有效应对遮挡或强烈光照等异常噪声所引起的目标外观变化。此外,OIMRT算法中还设计了一种新的目标-背景双向似然度测度函数。 再次,本文设计一种基于二维数据原型的观测建模框架,并提出了一种基于矩阵低秩表示模型的视觉目标跟踪算法(MLRT)。MLRT算法的观测模型中将候选样本外观的视觉表征问题直接看作二维矩阵而非一维向量,且将重构误差估计问题假设为低秩构造的块噪声和稀疏构造的离群噪声之和。同时,本文还提出了一种新的观测似然函数,不仅能够有效处理局部遮挡等噪声干扰,而且能够促使被跟踪目标与子空间很好地匹配。实验证明,基于二维数据原型的观测模型在信号建模和误差估计等问题上能够表现出良好的性能,相比传统方法简化了模型结构,从而减轻了高维特征映射带来的计算复杂度和资源开销。 从此,本文又借鉴MLST算法高效的多任务外观学习框架和MLRT算法优秀的二维数据原型描述机制,利用多线性分析方法提出一种基于张量核范数回归模型的视觉目标跟踪算法(TNRT)。该算法中,将张量分析引入到跟踪算法的观测建模中,以张量良好的数据结构来搭建跟踪算法的结构化多任务外观学习框架,从而提高跟踪算法的仿真建模能力和性能。 最后,围绕各跟踪算法的观测模型建模、最小重构误差构造、目标最大似然度估计、特征模板学习与良性更新等问题,从求解回归模型最优解的角度证明了算法设计的有效性。实验证明,本文跟踪算法的观测模型及其相关模块的设计是合理的,并且具有良好的收敛性质。最终,本文采用本领域公认的一些富有挑战性的公开测试视频数据库,对本文跟踪算法以及其它6款经典的同类跟踪算法进行了跟踪性能综合比较与评估。