论文部分内容阅读
随着计算机视觉在监控领域的快速发展,越来越多的计算机研究学者把目标锁定在行人重识别方法的探索中,使此热点成为了计算机视觉领域中占比较大的研究课题。行人重识别技术的主要作用是判断在不同的时间、不同的地点、不同的摄像头所捕获的行人是否为同一个身份,此项技术应用于智能安防、刑事监察、时空轨迹追踪和商业区管理等。该技术研究所面临的挑战有人脸遮挡、视频低分辨率、拍摄角度、光照以及大范围空间下行人轨迹严重碎片化所造成视频数据无法有效利用等等。目前,研究学者针对行人重识别技术的两大主流研究方向是行人特征表示和度量学习,本文以此两大研究方向为主干,创新了几个有效的方法来提高行人识别率。在提取行人特征表示方向,我们提出以几种经典深度网络为内核,每一阶段都进行回传的多重反向传播网络,提高特征精细度。在度量学习方向,我们以欧式距离为基础,提出重排序欧式距离的方法,并与其它几种传统度量方法进行优化加权融合,得到更加鲁棒的矩阵,从而提高行人识别率。本文所做的主要贡献总结如下:(1)基于多重反向传播网络的行人重识别特征研究:考虑到深度网络模型由浅层到深层传播过程中行人图片特征尺寸会减小,从而会丢失一部分图片特征信息,使可度量的数据减少,会损失一部分识别精度。基于这个现象,我们提出了多重反向传播网络特征学习的方法(Multiple Back Propagation Network,MBP)。MBP方法的网络框架是在原始Res Net50[1]和Dense Net121[2]的基础上进行拓展的,我们以Dense Net121为例,每个Dense-conv层后连接一个MBP子层,且每个MBP子层又分为两个子流,其中一个子流以全连接方式连接,并用于计算Softmax损失,另一个子流以一个conv层连接减小尺寸,并用于计算Tripletloss损失,最后所有降维特征串联在一起作为行人图片的最终特征。根据实验结果表明,多重反向传播网络特征相比原始深度框架所提取的特征有了显著的提升。(2)基于重排序欧式距离的行人重识别算法研究:考虑到传统的距离度量算法只是简单地线性度量,识别率偏低,且无法解决全自动、无监督等问题,这给多目标行人分类带来很大的麻烦,因此我们提出重排序欧式距离(Re-ranking Euclidean)。首先把行人图片通过它的阶倒数近邻(-reciprocal nearestneighbors)编码成为一个单体向量,然后计算它的阶倒数特征,最终经过重排序计算欧式距离。简单来说就是定义一个候选集和一个查询图片,找出查询图片在候选集中的近邻,然后计算其阶倒数近邻,最后带入原始的欧式距离公式,得出重排序欧式距离。实验结果表明,重排序欧式距离的效果较传统距离度量算法有显著的提升。(3)基于度量融合的行人重识别算法研究:单个深度行人特征或许能取得好的试验效果,但是每个深度模型都存在自己的优缺点,考虑到这个问题,我们提出一种叫做度量融合(Metric Fusion,MF)的行人特征后期融合方法,重排序欧式距离联合其它几种距离度量算法分别与两种不同网络所提取的行人特征作用后进行加权融合得到最终度量距离,此外,我们还定义了一个自动学习权值的优化算法,可以使融合后同一个身份行人图片特征之间的距离尽可能的小,不同身份行人图片特征之间的距离尽可能的大,从而使识别率取得进一步的提升。实验结果阐明,MF方法较单度量算法有着一定的提升。