基于深度学习的视频行人再识别方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:aramis_Rose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习在计算机视觉领域取得了极大的成功,基于深度学习的智慧监控系统研究也获得研究人员的广泛关注。行人再识别问题作为智慧监控系统的重要组成部分,在寻找走失人口、侦办刑事案件、城市安全管理等方面具有巨大的作用,成为了新的研究热点。视频行人再识别的主要任务是基于视频序列判断由不同摄像机捕获的行人是否为同一身份。然而,由于不同摄像机捕获行人的角度不同,光照条件不同,以及物体或行人之间遮挡等问题,如何准确地实现行人再识别仍是一个巨大的挑战。本文针对目前的视频行人再识别方法进行了深入总结和研究,对存在的问题做出改进。当前的视频行人再识别方法大都需要提前手动提取光流图来计算行人的运动特征,而手动提取光流特征费时费力且光流图会占据大量磁盘空间,不利于应用到实际中。为了解决这一问题,本文提出了一种基于光流引导特征的视频行人再识别方法。首先使用卷积神经网络提取行人图像的空间外观特征,并根据深度特征图计算光流引导特征来描述行人运动信息;然后联合行人空间外观特征与时间运动特征,获得视频级的行人特征描述矢量;最后计算特征描述矢量之间的欧式距离,判定两段图像序列中的行人是否为同一身份。实验证明,该方法能够有效简化网络结构,实现较高的识别准确率。目前大部分方法都希望尽可能地获取更多信息来实现行人再识别,然而并非所有信息都能够为行人再识别做出足够贡献,注意力机制能够通过提取有效行人信息,抑制无用信息,将更多的计算资源应用到关键信息上,提升行人再识别的准确率。本文结合注意力机制,提出了一种基于时空注意力的视频行人再识别方法,首先采用残差注意力网络实现对特征图的通道和空间维度有效信息的提取,并通过时间注意力模型实现时间维度上的有效特征提取,然后综合通道、空间和时间三个维度的有效信息获得更具有辨识力及更全面的视频级行人特征描述矢量,最后使用多任务损失来训练网络。在数据集iLIDS-VID、PRID-2011上进行实验,其识别准确率高于目前的大部分方法,证明了该方法的有效性。
其他文献
大气温湿度廓线信息是数值天气预报和气候变化评估等科学研究必不可少的基础数据,利用高光谱卫星数据准确定量地反演高精度的大气温湿度廓线,对提高天气预报和气候预测能力具
电子产品中的金属元器件易受周围环境介质的化学和电化学作用而发生腐蚀,造成性能下降、能耗增高、甚至功能丧失等后果。涂覆防护涂层是业内防止电子产品腐蚀最有效的方法之
随着时间的发展,网络在生活和各个方面的应用越来越重要.因此,信息安全问题也越来越受到重视,如信息攻击和防御。学者们对于密码学的研究也在不断发展.移位寄存器在密码学中
行人检测技术属于计算机视觉的研究范畴,旨在通过算法准确识别并定位图像中的行人。无人驾驶汽车、智能机器人和监控安防等不胜枚举的场景应用中都离不开行人检测技术的支撑
近年来中国的市场经济建设取得了良好的成绩,人民的物质生活水平不断提高。在这种时代背景下,不同经济主体之间的贸易往来日渐频繁,彼此间的法律关系逐渐复杂,矛盾纠纷的产生
本文针对转向架轴距尺寸与平行度三维检测的关键技术,设计并构建了列车转向架轴距尺寸与平行度测量系统,开展了线结构光标定技术、列车转向架轮对三维重构技术、列车转向架轴
近年来随着科学技术的快速进步,有机电子学也得到了迅速发展。而且由于有机电子器件与传统无机器件相比,尤其在材料的获取、工业生产过程以及实际应用等方面有着独特的性能,
飞机起落架是一种用于起降、滑跑的装置,它在整个飞机中占有重要的位置。然而飞机起落架中的防扭臂结构极易在飞机降落过程中发生破坏,故对防扭臂结构进行优化设计极其重要。国内外学者主要是对防扭臂结构进行尺寸优化设计,很少有学者对其进行拓扑优化设计,即使有学者对其进行拓扑优化设计,也只是通过理论计算获得工况条件或利用前人得到的试验数据作为工况条件,很少有学者利用虚拟样机技术(ADAMS)对整个起落架进行落震
学位
随着产业技术升级,智能安防监控、图像采集、目标识别与追踪等设备在粮库安全保障中得到大面积推广。安防视频监控系统能够对粮库主要的进出口储粮通道、库区、作业点、器械
并联管路流量分配不均匀问题广泛存在于油田油气集输系统中,转油站来流系统来流的不确定性导致并联管路“偏流”工况的产生,来流在管道中的相态和流态随压力和管道形态的不同