【摘 要】
:
行人再识别也称行人重识别,作为计算机视觉任务中的最新研究方向之一,在安防监控、公安刑侦等公共安全领域有着极为重要的作用。随着科技的不断进步以及深度学习的不断发展,行人再识别近年来也得到了社会各界的广泛关注。基于深度学习的行人再识别方法相比于传统方法虽然有了很大的提高,但是当前的行人再识别依旧存在许多难点。在真实场景中行人所处环境较为复杂,在对输入的视频序列进行特征提取时,如何从含有复杂背景的行人序
论文部分内容阅读
行人再识别也称行人重识别,作为计算机视觉任务中的最新研究方向之一,在安防监控、公安刑侦等公共安全领域有着极为重要的作用。随着科技的不断进步以及深度学习的不断发展,行人再识别近年来也得到了社会各界的广泛关注。基于深度学习的行人再识别方法相比于传统方法虽然有了很大的提高,但是当前的行人再识别依旧存在许多难点。在真实场景中行人所处环境较为复杂,在对输入的视频序列进行特征提取时,如何从含有复杂背景的行人序列中有效的过滤背景噪声并提取更有判别力的行人特征,这对特征提取网络提出了很高的要求。此外,行人序列中可能存在的遮挡问题也给行人再识别带来了很大的挑战。针对上述难点,本文完成了以下研究工作:如何有效解决行人再识别中复杂背景的影响;如何提高网络对输入视频序列的特征提取能力;针对行人被遮挡问题提出相应的解决办法;行人再识别网络的整体优化。本文首先针对视频行人再识别中输入序列背景复杂的问题,采用双辅助序列对原始行人视频序列进行引导。通过光流算法和语义分割算法分别获取原始行人序列的光流序列及掩模序列,利用光流序列和掩模序列能够区分行人前景与背景噪声的特性,将二者共同组成针对原始序列的辅助序列。在行人再识别中将原序列与辅助序列共同作为神经网络的输入,通过两辅助序列来引导特征提取网络对原始序列进行更为有效的特征提取。在网络结构方面,为了从输入的序列中获取更有判别力的行人特征,本文将对比几种最新的特征提取网络结构并结合其优点设计新型特征提取网络。而且,为了针对行人遮挡问题,本文还将空间、时间注意力机制嵌入行人再识别任务中,对基于时空注意力机制的视频行人再识别方法进行研究。通过时空双重注意力机制让神经网络在完成行人再识别任务时能够有效放大输入序列中对识别有效的部分,弱化对识别无用甚至可能起到负作用的部分,让神经网络也能够拥有类似人类的视觉注意力机制,知道该“看哪里”以及“何时看”。并通过大量实验证明了引入时空注意力机制的有效性和合理性。在网络的训练及测试方面,本文将通过实验对比来选择针对行人再识别问题更为有效的损失函数以使网络能够更好的被训练。并针对数据量较小的数据集,采用相似性融合策略,不仅使网络在训练时能够拥有更多的数据量,还能在测试时通过更为有效的评估方式进一步提升行人再识别的准确率。
其他文献
特种设备安全作为安全生产工作的一个重要组成部份,关系经济社会发展和国家的稳定,联系着人民群众的生命和财产安全。研究分析基层特种设备安全监察工作现状与普遍性问题,并
在外语阅读过程中,焦虑作为一种常见的情感因素可能会阻碍学习者获取外语信息。本研究以二语习得理论和外语焦虑相关研究为指导,结合自己的教学实践,对小学六年级学生英语阅
传统防火墙是一台真实物理服务设备,主要控制网络中南北向流量;虚拟防火墙如同具有安全服务的特殊虚拟机,拥有独立的管理员、系统资源、用户认证、安全策略、数据库等。传统的防火墙部署缺陷和应用的不足是虚拟化防火墙产生的关键之一。访问控制系统是防火墙的最中要的组成部分,为了满足用户在不同时间段允许或禁止访问网络资源,访问控制系统中配置防火墙策略时引入了时间的限制,由于时间的增加导致防火墙策略之间存在的冲突类
在WSON骨干传送网中,业务沿着光路径传输会经历各种损伤,这些损伤随着信号传输距离的增大逐渐累积,造成光信号传输距离受限问题。光信噪比(OSNR)是衡量光网络信号传输质量的重要指标。目前WSON骨干传送网中应用最多的物理损伤补偿方式是设置电中继。电中继是建网中的主要成本,合理中继节点的选择及合理的中继方式可大大降低建网成本。为此本文提出了一种基于物理损伤的WSON骨干传送网中继算法(RA),该算法
当前,中国经济已由高速增长转向高质量发展阶段,正处于转变发展方式、优化经济结构、转换增长动力的攻关期。政府加快落实减税降费政策,优化市场环境,激发市场活力,推进经济的高质量发展。企业作为市场经济中最活跃的主体,企业积极转型创新,提升产品质量,清洁绿色发展,承担好各个利益相关者的社会责任,对于促进经济提档升级,实现经济的高质量发展意义巨大。但是,我国企业目前的社会责任实践情况不佳,企业失责事件频发,
随着遥感技术的飞速发展,其越来越多的被应用在国防安全、国土规划、农业和金融等多种领域。对遥感图像进行合理有效的土地覆盖类型识别是诸多应用的基础。应用特征提取与分析的图像处理手段进行土地覆盖类型识别面临着图像特征提取复杂、缺乏泛化性和成本较高等缺点。近年来伴随着深度学习的发展,语义分割技术带来了一种研究土地覆盖类型识别的新视角。深度学习针对大数据自动学习特征,在语义分割的一些应用中取得了出色的成绩,
在经济发展和新社会阶层逐渐形成的背景下,不同阶层具有不同的体育价值观,因此在体育活动和社区体育公共服务的需求方面也不尽相同。另外,在特定的经济发展态势下,针对多类群
协同过滤算法作为一种广泛应用的推荐算法,受到了人们的青睐,它通过利用用户对物品的历史评分等有关信息来预测物品的评分,向目标用户生成推荐列表。基于矩阵分解的推荐算法通过将评分矩阵分解为用户特征矩阵与物品特征矩阵来计算预测评分,但并没有充分挖掘用户与物品的属性信息,为此,本文提出了一种将矩阵分解与神经网络结合起来的方法,并加入属性信息以提高预测精度。信息核是数据集中少数但却有着关键信息的用户,真实信息
弯曲菌(Campylobacter spp)是一类能够引起人类腹泻的人兽共患病病原菌。在已发现的弯曲菌种类中,空肠弯曲菌和结肠弯曲菌是引起人类腹泻的主要致病菌,90%以上的病例由这两种病原引起,而其中空肠弯曲菌和结肠弯曲菌分别约占90%和10%。传统生化方法在鉴定弯曲菌时存在步骤多、耗时长、通量低等问题,而PCR方法试剂昂贵,且实验步骤多,容易产生样本间的交叉污染,从而导致假阳性和假阴性结果。近年
近年来,深度学习在诸多领域都取得了很好的效果,不过其最大弊端,就是学习过程中需要大量标注好的训练数据,而这会消耗很多的时间和精力。零次学习能够较好的解决这个问题,它通过标注好的可见类的训练集和关于不可见类与可见类语义相关的知识进行学习训练,使得模型能够识别出训练过程中未出现的类别样本。零次学习中有视觉特征与语义特征,这两种特征能否较好地表示相应类别对最后的分类结果有很大影响。因此对特征本身的优化非