论文部分内容阅读
目标跟踪近年来取得了显著进展。经过优化以识别图像中物体的深度神经网络模型显示出前所未有的任务训练精度,并且具有很好的泛化能力。本文采用卷积网络深度学习方法主要研究目标跟踪算法,具体研究内容如下:
(1)针对提取特征方法的不同将算法分为人工设计特征的跟踪算法和深度学习跟踪算法两大类,详细分析了它们的方法思路和模型结构;接着选择当下最流行的数据集对算法进行评估比较并分析不同方法会对跟踪结果造成的不同差异的原因,便于研究者选择合适的方法实现期望达到的性能,清晰地展现出深度学习方法应用于目标跟踪乃至计算机视觉领域的广阔前景和研究意义。
(2)基于深度学习的目标跟踪算法与使用人工设计特征的目标跟踪算法相较具有很多优势,但也存在一些不足,比如深度学习有监督的训练数据不足,深度学习算法普遍具有的实时性不佳的问题等。针对这些问题,提出一种方法首先采用孪生网络结构训练一个具有普适性的跟踪器使其不需要面对不同视频时进行针对性训练,并采用相关滤波器代替SGD方法加快跟踪的速度,同时给相关滤波器增加相关的正则项优化其性能。在OTB基准上首先与基准框架跟踪器比较得出改进优化后的性能增益,再与其他使用人工设计特征和深度特征的跟踪器比较可以得出结论:与人工设计特征的跟踪器相比,深度特征的使用可以显著提高跟踪性能。
(3)引入目标检测技术,使用目标定位方法进行目标跟踪。通常目标定位方法中的候选块都会随机地放置在先前目标位置和估计目标位置的周围,但是这样提取特征时会造成了大量的冗余。于是提出一种加速基于卷积神经网络的跟踪器运算的新方法,将整个感兴趣区域一次性输入卷积神经网络以消除生成随机候选块时产生的冗余运算。首先将每个候选块分类为对象或背景,然后分出目标所在对象块作为为粗略定位,最后将卷积神经网络特征的双线性插值用作精细定位。通过在OTB100上的实验结果表明,不仅保持了与顶级跟踪器相当的精确度和鲁棒性,还获得了数倍的加速。
(4)最新的目标跟踪工作集成了跟踪和检测方法利用两者的优点,融合生成式和判别式方法明显提高了跟踪器的跟踪能力。于是提出了一种融合方法,将深度学习和粒子滤波相结合,融合了判别式框架和生成式框架的优势,以满足有效跟踪可变形和遮挡目标的要求。首先引入区域推荐优化(RegionProposalOptimization,RPO)方法,去除不合格的区域推荐从而大大提高定位精度,并且用动态建模的方式模拟由运动和遮挡引起的目标对象外观变化,使算法能够自适应地更新目标模型,从而提高跟踪器对高速运动和遮挡引起的外观变化的鲁棒性。
(1)针对提取特征方法的不同将算法分为人工设计特征的跟踪算法和深度学习跟踪算法两大类,详细分析了它们的方法思路和模型结构;接着选择当下最流行的数据集对算法进行评估比较并分析不同方法会对跟踪结果造成的不同差异的原因,便于研究者选择合适的方法实现期望达到的性能,清晰地展现出深度学习方法应用于目标跟踪乃至计算机视觉领域的广阔前景和研究意义。
(2)基于深度学习的目标跟踪算法与使用人工设计特征的目标跟踪算法相较具有很多优势,但也存在一些不足,比如深度学习有监督的训练数据不足,深度学习算法普遍具有的实时性不佳的问题等。针对这些问题,提出一种方法首先采用孪生网络结构训练一个具有普适性的跟踪器使其不需要面对不同视频时进行针对性训练,并采用相关滤波器代替SGD方法加快跟踪的速度,同时给相关滤波器增加相关的正则项优化其性能。在OTB基准上首先与基准框架跟踪器比较得出改进优化后的性能增益,再与其他使用人工设计特征和深度特征的跟踪器比较可以得出结论:与人工设计特征的跟踪器相比,深度特征的使用可以显著提高跟踪性能。
(3)引入目标检测技术,使用目标定位方法进行目标跟踪。通常目标定位方法中的候选块都会随机地放置在先前目标位置和估计目标位置的周围,但是这样提取特征时会造成了大量的冗余。于是提出一种加速基于卷积神经网络的跟踪器运算的新方法,将整个感兴趣区域一次性输入卷积神经网络以消除生成随机候选块时产生的冗余运算。首先将每个候选块分类为对象或背景,然后分出目标所在对象块作为为粗略定位,最后将卷积神经网络特征的双线性插值用作精细定位。通过在OTB100上的实验结果表明,不仅保持了与顶级跟踪器相当的精确度和鲁棒性,还获得了数倍的加速。
(4)最新的目标跟踪工作集成了跟踪和检测方法利用两者的优点,融合生成式和判别式方法明显提高了跟踪器的跟踪能力。于是提出了一种融合方法,将深度学习和粒子滤波相结合,融合了判别式框架和生成式框架的优势,以满足有效跟踪可变形和遮挡目标的要求。首先引入区域推荐优化(RegionProposalOptimization,RPO)方法,去除不合格的区域推荐从而大大提高定位精度,并且用动态建模的方式模拟由运动和遮挡引起的目标对象外观变化,使算法能够自适应地更新目标模型,从而提高跟踪器对高速运动和遮挡引起的外观变化的鲁棒性。