论文部分内容阅读
近年来,随着智能视频监控、智能交通、车辆辅助驾驶系统以及智能机器人等领域的快速兴起,越来越多的任务需要利用计算机视觉技术辅助完成。行人检测和行人重识别作为计算机视觉的热门研究方向,受到了相关领域研究人员的广泛关注,近年也得到了快速发展。但是,由于实际应用场景中监控环境的复杂性、行人姿态的多变性以及行人遮挡问题的普遍存在性,面向复杂场景的行人检测和行人重识别还存在诸多挑战和难点。首先,考虑到复杂场景中行人分辨率较低、不同行人之间尺度差异较大以及行人遮挡严重等问题,本文在Faster R-CNN行人检测算法的基础上,利用Precise RoI Pooling和多尺度感受野网络对算法进行改进,一方面增加了网络特征感受野尺度的多样性,另一方面提高了感兴趣区域池化提取到的特征准确性。改进后的算法对复杂场景中的行人检测有更好的适应能力。其次,本文提出基于Faster R-CNN的双通道网络模型。针对弱光环境中的行人检测,热度图像相较于RGB图像具有更多信息,本文通过双通道网络设计实现了RGB图像和热度图像特征的融合,利用特征融合技术使两类特征之间的信息可以相互补充,增加了行人特征的多样性。改进后的算法对环境光线具有更好的鲁棒性,提升了行人检测算法在弱光环境下的性能。再次,考虑到复杂场景中行人的体貌特征变化较大以及行人图像视角变化明显的特点,本文在PCB行人重识别模型的基础上提出了联合特征多样性和分块局部特征加权的PCB-DB模型,兼顾了行人图像的全局和局部特征,丰富了行人特征的有效信息,通过分块局部特征加权的方式使模型能够对多个局部特征进行区分,并联合交叉熵损失和Batch Hard Triplet Loss指导PCB-DB模型的训练。改进后的模型能够更好的适应复杂场景下的行人重识别任务。最后,搭建了面向视频监控场景的行人自动检测和重识别软件系统。此系统能够处理多个不同场景下的监控视频数据并实现跨场景的行人检测和重识别。