论文部分内容阅读
近年来,随着深度学习在计算机视觉领域取得了极大的成功,基于深度学习的智慧监控系统研究也获得研究人员的广泛关注。行人再识别问题作为智慧监控系统的重要组成部分,在寻找走失人口、侦办刑事案件、城市安全管理等方面具有巨大的作用,成为了新的研究热点。视频行人再识别的主要任务是基于视频序列判断由不同摄像机捕获的行人是否为同一身份。然而,由于不同摄像机捕获行人的角度不同,光照条件不同,以及物体或行人之间遮挡等问题,如何准确地实现行人再识别仍是一个巨大的挑战。本文针对目前的视频行人再识别方法进行了深入总结和研究,对存在的问题做出改进。当前的视频行人再识别方法大都需要提前手动提取光流图来计算行人的运动特征,而手动提取光流特征费时费力且光流图会占据大量磁盘空间,不利于应用到实际中。为了解决这一问题,本文提出了一种基于光流引导特征的视频行人再识别方法。首先使用卷积神经网络提取行人图像的空间外观特征,并根据深度特征图计算光流引导特征来描述行人运动信息;然后联合行人空间外观特征与时间运动特征,获得视频级的行人特征描述矢量;最后计算特征描述矢量之间的欧式距离,判定两段图像序列中的行人是否为同一身份。实验证明,该方法能够有效简化网络结构,实现较高的识别准确率。目前大部分方法都希望尽可能地获取更多信息来实现行人再识别,然而并非所有信息都能够为行人再识别做出足够贡献,注意力机制能够通过提取有效行人信息,抑制无用信息,将更多的计算资源应用到关键信息上,提升行人再识别的准确率。本文结合注意力机制,提出了一种基于时空注意力的视频行人再识别方法,首先采用残差注意力网络实现对特征图的通道和空间维度有效信息的提取,并通过时间注意力模型实现时间维度上的有效特征提取,然后综合通道、空间和时间三个维度的有效信息获得更具有辨识力及更全面的视频级行人特征描述矢量,最后使用多任务损失来训练网络。在数据集iLIDS-VID、PRID-2011上进行实验,其识别准确率高于目前的大部分方法,证明了该方法的有效性。