论文部分内容阅读
行人再识别是计算机视觉技术的热点问题之一,主要对不同摄像机点位获取到的图像或视频序列中的行人目标进行检索匹配和同一认定。受光照、复杂背景、遮挡以及行人姿态各异的影响,行人再识别算法在实际应用中存在提取特征鲁棒性较差的问题,导致识别精度较低,难以满足实际应用需求,因此行人再识别受到众多学者的关注。本文围绕基于深度学习的跨域行人再识别方法,在行人检测、行人再识别、人脸识别等方面展开研究。具体工作内容如下:在行人检测方面,将RetinaNet网络作为基线模型,提出了基于通道交互机制和软化非极大值抑制联合改进的行人检测方法。首先,在RetinaNet模型的特征提取网络中引入通道交互机制ECA模块,提高模型对于通道信息的细节捕捉能力。然后,使用Soft NMS替换传统的非极大值抑制,解决了传统非极大值抑制操作导致的召回率降低问题。最后,在Caltech数据集上对改进后的模型进行评估测试。实验结果表示,基于两种方法联合改进后的模型相较于原模型,漏检率降低了0.78%,AP50提升了0.5%,Recall提升了2.4%。在行人再识别部分,在AlignedReID++模型基础上提出了两种改进方法。方法一:通过在AlignedReID++模型的特征提取网络中引入实例归一化层IN,与模型中原有的批归一化层BN共同组成IBN层,解决网络对于不同颜色、纹理风格特征鲁棒性不高的问题。方法二:在方法一的基础上引入了特征空间分组模块SGE,进一步提高模型对于特征空间位置信息的敏感度。在Market1501、Duke MTMCRe ID、CUHK03三个数据集上对方法一和方法二联合改进后的模型进行测试,在三个数据集上Rank1击中率分别提升了0.8%、2.9%和4.7%,m AP分别提升了2.7%、3%和3.2%。在人脸识别部分,首先,实现了基于DSFD的人脸检测,并在WIDERFACE数据集和真实场景下对算法性能进行了评估。然后,通过在Mobile FaceNet人脸识别网络中引入风格特征重校准模块SRM,提高人脸识别模型对于不同风格人脸图像的鲁棒性。最后,在LFW、CFP-FF和Age DB三个人脸数据集上对改进后的模型进行评估,改进后的人脸识别模型在三个数据集上的准确率分别提高了0.25%、0.16%、0.3%。在行人再识别软件实现方面,使用Pytorch深度学习框架,利用Python实现核心算法,Py Qt5语言设计界面,完成行人再识别软件。该软件具有行人检测、行人再识别、同行人分析、人脸检测和人脸识别等功能。