论文部分内容阅读
无重叠区域多摄像机下的行人重识别,是指对单摄像头下的行人目标在其他无重叠区域的摄像头中重新寻找的过程,是智能视频监控的重要组成部分。行人重识别在图形搜索,刑侦探案等方面有着重要的应用价值。由于行人姿态变化、图像分辨率低下、环境变化等干扰因素的存在,使得目前行人重识别的准确度并不高。因此提高行人重识别的准确度具有重大的意义。为了提高准确度,针对神经网络框架难以设计及训练时难以收敛等问题,本文基于Alexnet网络模型设计了迁移学习,对已有的模型进行改进,并与XQDA(Cross-view Quadratic Discriminant Analysis)算法结合。针对传统方法,设计了新的背景抑制方法来降低背景的影响,进而提高准确度。主要研究工作如下:(1)研究行人重识别的国内外研究方法:基于特征表示的方法、基于距离测度的方法、基于深度学习的方法。对比分析三种方法的优缺点,找到改进方向。(2)针对神经网络模型结构难以设计且难以收敛等问题,本文基于Alexnet模型进行迁移学习。通过改进Alexnet模型的最后一层,使其可根据行人重识别的任务要求进行自适应调整参数,从而实现迁移学习,同时网络容易收敛。通过提取神经网络模型第二个全连接层的深度特征,并使用XQDA算法进行相似性度量,进一步提高了准确度。在CUHK03数据集、DukeMTMC-reid数据集上进行实验验证,CMC-1分别高达56.2%、53.53%。(3)针对小样本数据使用深度学习方法进行行人重识别准确度不高的问题,本文对传统方法进行了改进,设计了一种背景抑制方法。该方法将HOG特征和随机蕨进行结合,计算基于HOG域的随机蕨特征。并使用K-means聚类算法对得到的基于HOG域的随机蕨特征进行分类,筛选并去除背景类,从而实现背景抑制。接着提取颜色直方图特征和SIFT特征,使用XQDA算法衡量不同特征之间的相似性。在viper、CUHK01等数据集上进行了实验验证。相对于未进行背景抑制的方法,本文方法在两个数据集上CMC-1分别提高了8个百分点和6个百分点。并与第三章的方法进行了对比,CMC-1分别提高了2.5倍和2倍。