论文部分内容阅读
视觉目标跟踪是计算机视觉里最基本的研究问题之一,其核心任务是估计视频序列中目标的运动状态,包括目标大小、目标位置、运动方向等,能进一步为后续高层次的视觉任务提供重要数据。目标跟踪能成为近年计算机视觉里研究的热点话题,得益于在智能交通、视频监控、人机交互等领域的广泛应用。过去几年,虽然目标跟踪算法取得了很大进展,但在实际应用中,目标的外观通常会受到光照变化、遮挡、快速运动、背景杂乱等因素影响,实现鲁棒的目标跟踪任务仍然具有很大的挑战。论文主要依据稀疏表示和相关滤波的基本理论,围绕如何设计一个鲁棒的外观模型、度量跟踪结果的可靠性、减轻模型漂移三个主要问题,研究目标跟踪的方法,具体研究内容和创新点如下:(1)提出了一种全局稀疏表示和多尺度局部稀疏表示联合的目标跟踪模型。基于稀疏表示的目标跟踪模型,大体分为全局稀疏表示和局部稀疏表示。全局稀疏表示模型能够捕获目标的全局信息,适用于目标的整体外观变化,如姿态变化、照明变化等场景。局部稀疏表示模型将目标分成一系列局部小块,能够捕获目标的局部信息,适用于部分遮挡、局部形变等场景。为了有效的建模目标外观,论文将两种模型结合,利用两者的优势互补进行目标跟踪。在局部稀疏表示的模型中,通常只在一个尺度下对目标进行分块。为了能够捕获不同尺度下目标的局部信息,增强目标的表示能力,论文将目标在不同的尺度下独立的分成一系列的小块,分别进行稀疏编码构成目标的外观表示。在局部模型里,本论文采用直方图交叉函数度量不同尺度下候选目标和对应尺度下模型的相似性,并基于块污染描述子设计了不同尺度下模型相似性度量的权重系数,将不同尺度下各模型相似性度量进行加权作为局部模型下的相似性度量结果。最后在贝叶斯框架下利用两个模型合作的相似性度量得分来估计目标运动状态。(2)提出了一种块描述子和结构局部稀疏表示结合的目标跟踪方法。在利用结构局部稀疏表示建模目标外观模型的跟踪器中,并没有考虑每个块的不同状态;在跟踪过程中,当这些块的外观变化不一致时,这将影响跟踪性能。针对这个问题,论文设计了块描述子来反映目标外观变化时每个块受到噪声污染的程度。首先将目标分成多个非重叠的局部块,并利用结构局部稀疏表示计算每个块的稀疏表示系数。其次进一步将每个局部块再分成多个子块,并将块描述子定义为各局部块中子块重建误差小于给定阈值的子块个数占各局部块中子块总数的比率。然后联合利用结构局部稀疏表示系数和块描述子建模目标的外观。最后为了适应目标的外观变化和缓解模型漂移,提出了一种异常知晓的模型更新策略。(3)由于计算的高效和性能的优越性,核相关跟踪在近年受到了极大的关注。但是基于核相关滤波的跟踪方法仍然存在一些缺点苛待改进,如特征单一、缺乏目标的尺度估计和跟踪可靠性判断机制等等。针对这些问题,论文提出了一种具有在线重检测机制的合作相关滤波跟踪框架。在不同的场景下,不同的特征具有不同的区分目标和背景的能力。本文首先根据多个不同的特征独立的学习了多个核相关滤波器,并提出了一种简单而有效的基于点乘的相关响应图融合方式,以获得最终的响应图。基于点乘,响应图可以互为滤波器滤除彼此的噪声,以获得一个更可靠的响应图,提高位移估计的准确性。其次,构建了一个尺度滤波器用于处理目标的尺度变化。而且,为了进一步提高跟踪的准确性,论文设计了一个跟踪可靠性度量标准和在线重检测器。当跟踪不可靠时,启动在线检测器,在局部区域内对目标进行重检测,以校正跟踪结果。(4)提出了一种多通道特征集成的实时核相关滤波跟踪方法,该方法基于低维特征。多通道特征集成通常能提高相关滤波器的跟踪性能,然而相关滤波计算的时间损耗与特征的维数成线性关系。为了减小计算代价,论文基于主成分分析对多通道特征进行了降维。不同于标准的核相关滤波跟踪器,论文提出在位移估计中采用两个核相关滤波器用于粗到细搜索定位。在粗搜索阶段,采用大的搜索窗,以便处理快速运动及从潜在的漂移中恢复模型;在细搜索阶段,采用小搜索窗从粗定位中进一步提炼目标的位置。此外,针对因噪声污染的样本进入模型更新而导致模型漂移的问题,论文基于最大相关响应和平均峰值相关能量设计了一个准则度量跟踪的可靠性。当度量结果低于给定阈值时,停止更新跟踪模型以缓解模型漂移。(5)提出了一种将相关滤波和卷积神经网相结合设计鲁棒跟踪器的方法。该方法采用预训练的VGGNet-19多层卷积神经网络提取目标的Conv3-4、Conv4-4和Conv5-4层卷积特征,然后训练三个独立的判别式相关滤波器。在跟踪过程中分别计算卷积响应,并基于点乘将卷积响应融合形成最终的响应图输出,用于定位目标。为了适应目标外观的变化,采用插值的方法更新各相关滤波器。针对模型漂移问题,论文依据乘积融合后输出响应图的尖峰旁瓣比、跟踪框重叠率和跟踪轨迹平滑程度设计了一个置信度量准则,用于调整模型更新中的学习率。