论文部分内容阅读
红外目标跟踪在计算机视觉领域一直备受瞩目,目前在精确制导、侦察、视频监控等军事和民用领域都已得到了广泛的应用。但是红外图像比起可见光图像对比度更低,缺乏纹理和颜色等信息,因此,现有的视觉跟踪算法难以适用于红外目标跟踪。本文采用生成式跟踪算法,基于稀疏编码原理对目标进行表观建模,在粒子滤波算法框架下对目标进行定位,从而实现对红外目标的持久鲁棒跟踪。本文的主要贡献如下:首先,本文提出了一种基于稀疏编码理论的表观建模方法。将目标分成若干有重叠的相同大小的图像块,分别提取每一图像块的SIFT特征,以解决目标遮挡、旋转等问题;利用K-SVD方法线下训练得到特征字典,并在线对各图像块的SIFT特征进行稀疏编码,以便更加准确地描述图像;最后,基于空间金字塔匹配技术,对所有图像块的稀疏向量进行多层金字塔池化,获得定长输出作为目标特征向量,保留了图像的全局和局部信息,能够有效解决目标局部/全遮挡问题,从而提高跟踪的鲁棒性。其次,本文为了提高算法实时性,提出了一种表观建模加速方法。采取类SIFT快速特征提取方法来获取各图像块的局部特征描述子,避免了提取SIFT过程中的不断下采样和插值等繁琐操作;采用局部约束线性编码替代稀疏编码,提高了连续几帧间目标特征表示的相似性,并且可通过简单的三步矩阵运算求出稀疏表示目标函数的解析解,避免了采用OMP算法计算稀疏向量需要进行的大量迭代计算,大大降低了计算复杂度,提高了算法效率。再次,本文在粒子滤波跟踪框架下实现了目标框的尺度自适应。与绝大多数跟踪算法通过引入尺度金字塔模型或尺度缩放因子等方法不同的是,本文为了避免对同一粒子的重复计算,仅给定粒子水平及垂直两个方向的尺度变化自由度,并引入马尔科夫预测模型准确预测尺度变化范围,在粒子滤波框架下对表征各粒子的目标框大小更新,来实现跟踪过程中目标框的尺度自适应缩放。此外,在跟踪过程中引进目标速度及加速度信息,以便对目标运动趋势进行准确的估计,从而解决传统跟踪算法无法跟踪快速移动目标问题或有近似运动目标相互干扰问题。最后,为了能更直观地展示本文算法跟踪效果以及评估各输入参数对跟踪结果的影响,本文还开发了一款Matlab GUI实验平台,该用户界面实现了文件的读取与保存、参数输入、跟踪过程实时显示及跟踪结果评估四大功能。用户可通过界面上的控件选取视频序列、设定参数来实现实验平台与底层算法的交互。本文基于此实验平台,选取了10个具有挑战性的公开测试序列进行了实验,将本文跟踪算法与8个最先进的跟踪算法进行比较,定量和定性分析的结果证明,本文算法在跟踪鲁棒性上整体优于其他算法。