论文部分内容阅读
多行人目标跟踪和行人重识别一直是计算机视觉研究中的重要领域,因多行人目标跟踪和行人重识别所具有的重大实际应用前景,吸引了众多国内外学者的关注。近几年随着深度卷积神经网络技术的发展,以深度卷积神经网络为基础,在两个领域中出现了许多有价值的研究成果。多行人目标跟踪与行人重识别的研究对象均为行人,并且面临的主要难题存在一定的相似性,例如,遮挡问题、目标表观的剧烈变化以及背景的复杂性等问题。经过长期的研究,虽然两个领域都取得了一定的进展,但遮挡以及由于目标表观变化而引起的不对齐现象依然是亟待解决的问题。针对上述问题,本文基于深度卷积神经网络提出了一个多行人目标跟踪算法和一个行人重识别算法,主要的研究内容如下:(1)针对多行人目标跟踪存在的问题,本文设计了一种基于深度对齐网络及遮挡和运动估计的多行人目标跟踪算法。算法首次利用深度对齐网络来对不准确的目标检测结果进行校正,该网络包含了一个对齐估计模块,能够自动的学习对这些不准确的目标检测结果进行空间的变换。经过验证表明通过深度对齐网络提取到的深度特征具有更好的表征能力并有助于对目标进行长时间的跟踪。此外,针对关联过程提出了一种由粗到细的模式来构建具有辨识力的关联损失矩阵,该矩阵中包含了空间,运动以及表观的信息。同时,针对遮挡问题设计了一个遵循严格规则制定的策略,综合了运动估计以及带有重识别能力的深度对齐网络的优点。最后,采用了简单且快速的匈牙利关联算法来求解设计的损失关联矩阵。(2)提出了基于局部辨析深度网络的行人重识别算法。考虑到人体是非刚性的,不同的行人通常需要局部线索作为辅助信息,并且行人重识别场景中不仅需要考虑到对特征图上的目标进行对齐,还需要学习特征图通道之间的对齐。为此,本文设计了一个基于融合行人姿态和属性信息的深度卷积神经网络的行人重识别算法,其中包括姿态分支和主分支,结合行人姿态以及属性信息来为行人建立更加鲁棒的深度表观特征。此外,还提出了结构简单的通道解析模块(Channel Parse Block,CPB)学习对姿态分支输出的特征图的通道进行加权,并通过使用紧密型双线性池化将加权特征图融合到主分支中。最后,利用交叉熵损失函数来对整个深度模型进行训练。