论文部分内容阅读
计算机视觉(Computer Vision)是一种探索如何让计算机从图像和视频中获取信息并进行分析和理解的新兴研究领域,基于视觉的目标跟踪则是计算机视觉中一个重要而富有挑战的研究方向。视觉目标跟踪是指对视频图像序列中的运动目标进行检测、识别和跟踪,从而获得目标的相关参数,如目标的位置、速度、尺度及运动轨迹等信息,并通过相关分析和处理来实现对运动目标进一步的行为理解或其他更高一级的任务。视觉目标跟踪是解决其他计算机视觉任务的基础,且随着现代社会对视频分析需求的不断增加,目标跟踪吸引了越来越多的科研人员的研究和关注,近年来也已经取得了长足的进步和发展。但是在实际跟踪过程中,由于目标自身运动的不确定性(如目标遮挡、目标自身运动形变等)和应用场景的复杂性(如外界光照改变、成像设备像素过低等)等原因,提出一种满足高精度性、普适性、实时性及鲁棒性等诸多要求的目标跟踪算法仍然是一项具有挑战性的任务。针对以上问题,本文在深入分析和调研传统视觉目标跟踪算法跟踪框架和跟踪原理的前提下,以生成式观测模型和判别式观测模型为研究基础,结合当前实际跟踪应用对算法性能的需求,提出了一些具有创新性和实用价值的视觉目标跟踪算法,有效地提高了跟踪算法的精确度和运行效率。本文完成的主要研究工作和成果总结如下:1)以生成式观测模型和稀疏表示理论为基础,提出了一种基于反向组稀疏Lasso模型的目标跟踪算法(ISGL算法)。基于稀疏表示理论的目标跟踪算法一般直接将模板当作字典原子,并采用这些字典原子来重构每一帧中的候选样本。这种重构方式需要对多个目标函数进行稀疏优化求解,且没有考虑到字典原子之间的组信息结构关系。为了降低求解优化问题的次数,提高算法的跟踪性能,本文将候选样本作为字典原子,利用大量的候选样本来重构每一帧中的正负模板。同时还将字典原子集中的原子按照相似性进行分组,根据每一个候选样本的组稀疏系数来确定最佳跟踪结果。本文中提出的反向组稀疏模型结合了反向稀疏表示和组稀疏表示的优势,同时还结合了模板与样本之间的原始结构信息,在降低优化求解时间的同时,又减小了重构误差,提升了算法的跟踪性能。为了进一步提高算法性能,ISGL算法在反向组稀疏表示模型的基础上,还构建了一个基于多信息融合的观测模型。该观测模型将距离权重矩阵与组稀疏系数矩阵相结合,最终得到一个更具有区分度和辨别力的稀疏映射表。实验结果表明,与一般的稀疏表示跟踪算法相比,本文中提出的反向组稀疏Lasso模型跟踪算法对复杂跟踪环境(低分辨率环境、运动模糊等场景)的适应能力有了明显提高,同时还降低了算法的计算复杂度,提高了目标跟踪算法的跟踪处理速度。2)以判别式观测模型和相关滤波理论为基础,提出了一种基于偏移空间权重的快速相关滤波跟踪算法(CWCB算法)。基于相关滤波理论的目标跟踪算法具有速度快和性能好的双重优势,并逐渐成为近年来的主流跟踪算法。这种相关滤波跟踪算法一般利用快速傅里叶变换的性质来提高算法运行效率,因而训练样本中的周期性假设所带来的边缘效应也影响了算法的跟踪性能。基于空间权重约束的相关滤波跟踪算法能够解决相关滤波跟踪算法中的边缘效应问题,但同时也牺牲了算法的运行效率。为了提高基于空间权重约束的相关滤波跟踪算法的运算效率,本文提出了一种基于偏移空间权重的快速相关滤波跟踪算法。CWCB算法通过构造一种具有特殊中心偏移的空间权重,使得其目标优化函数能够在实数域中直接计算而不需要任何额外的数据转化,从而有效地提高了算法的跟踪效率。此外为了解决跟踪过程中最常见的遮挡问题,本文算法还采用了一种基于平均峰值-相关能量值和滤波器响应最大值指标的遮挡检测策略。当算法检测到遮挡时则停止更新滤波器模板,以防止算法将错误的噪声模板混入其中。通过对遮挡问题进行检测并有选择性地进行更新,本文中的算法能够有效地降低遮挡问题对算法跟踪结果的影响,提高了跟踪算法的可靠性和准确度。实验表明,本文算法不但显著地提高了整体优化速度和跟踪效率,还对于遮挡、背景干扰等场景表现出了较好的鲁棒性和适应能力。综上所述,本文以具有代表性的生成式观测模型和判别式观测模型为研究基础,针对实际跟踪中常见的低分辨率、遮挡、背景模糊、光照变化等复杂跟踪场景,以及算法的运行效率等重要问题进行了有益的探索,提出了两种鲁棒的目标跟踪算法,为对视频目标跟踪的进一步深入研究及实际应用奠定了基础。