论文部分内容阅读
尽管视觉目标跟踪已被研究多年,但是,快速且高性能的算法依然缺失。其中,关键问题之一是:视频帧中的时空上下文信息并未被充分发掘利用,而这部分信息对于提升跟踪算法性能影响极大。为此,本文主要研究基于时空上下文学习的相关滤波快速跟踪算法,主要贡献概括为如下2点:(1)尽管相关滤波类跟踪取得了较好的效果,但是,其固有的样本循环假设导致样本冗余,不利于学到有效的分类器。本文提出了一种快速流形正则上下文感知相关滤波跟踪算法,来挖掘不同类型样本间的局部流形结构信息。首先,不同于只利用单一基样本的传统相关滤波跟踪方法,本文额外利用了一系列基样本周围的上下文样本,并对其施加流形结构假设。然后,考虑到这些样本之间存在的流形结构,本文在相关滤波学习中,引入线性图拉普拉斯正则项。巧合的是,这个优化问题能够利用快速傅里叶变换求得闭式解,因而能够实现高效计算。大量在OTB100和VOT2016数据集上的实验结果表明,本文提出的跟踪算法在准确性和鲁棒性方面,表现优于几个最先进的算法,并在单个CPU上以28fps的速度实时运行。(2)以上方法只利用一种相关滤波跟踪器,对目标复杂的非刚性形变及颜色变化表现不佳,为此,本文在时空正则相关滤波的基础上,通过设计一种新颖的颜色聚类直方图跟踪算法来弥补原先相关滤波模型的不足,进一步提出了基于颜色聚类和时空正则相关回归的互补跟踪器。所提方法包含两个互补的部分,可以自适应地处理每个序列显著的颜色变化和形变问题:首先,本文设计了一个新颖的基于颜色聚类的直方图模型,该模型首先自适应地将第一帧目标的颜色划分为几个颜色聚类中心,构建自适应颜色直方图,以适应严重的目标形变问题。另外,提出了学习时空正则化的相关滤波器,既能缓解边界效应,又能在目标剧烈变化时提供比标准相关滤波跟踪算法更稳健的表观模型。与其它实时算法相比,本文所提方法仅凭借简单的手工设计特征,在OTB100、Temple-Color和VOT2016这三个数据集上都取得了较好的结果。