论文部分内容阅读
目标跟踪作为计算机视觉技术的研究热点之一,在智能监控、人机交互等领域发挥着重要的作用。由于目标跟踪应用领域广泛、应用场景复杂,在目标跟踪中常常有跟踪失败的情况发生。不同领域的研究学者提出了许多不同的目标跟踪算法,其中基于孪生神经网络的SiamFC(Siamese Fully-Convolutional)目标跟踪算法由于较高的跟踪速度,自问世以来便得到了广泛关注。然而该算法跟踪精度偏低,为提升SiamFC跟踪算法对目标进行判别和定位的能力,本文从不同方面对该算法进行了改进。针对SiamFC特征判别能力不足,对一些背景干扰无法准确区分的缺点,本文在基础网络结构部分对该算法进行了改进。本文提出了一种无填充的内部裁剪残差单元,通过对神经网络结构的总体步长、最大感受野和输出特征尺寸三个方面的分析,搭建出多个不同的内部裁剪残差网络结构,并将这些网络结构用于目标跟踪,设计出了SiamICD(Siamese Inside Cropped Darknet)目标跟踪算法。本文使用该算法在OTB(Object Tracking Benchmark)测试数据集上进行了对比实验,并且证明了本文提出算法特征判别能力的提升。为进一步提升SiamICD算法的跟踪精度和成功率,本文在相似度决策和模型更新方式两个部分对算法进行了改进,提出了SiamICD-AFU目标跟踪算法。在相似度决策部分,本文提出通道分离交叉相关,并引入特征空间注意力机制和特征通道注意力机制,使对目标跟踪有利的特征空间位置和特征通道得到更多的关注。此外,还将使用低层特征获取的置信图和使用高层特征获取的置信图进行了加权融合,得到了更精确的位置信息。在模型更新方式部分,本文引入根据置信图震荡程度为判别依据的线性模型更新方式。本文提出的SiamICD-AFU目标跟踪算法在OTB-2015数据集中得到了0.882的跟踪精度和0.656的成功率,相比于原始SiamFC算法的0.771的跟踪精度和0.582的成功率,本文提出的目标跟踪改进算法可以有效提升原有算法的性能。