论文部分内容阅读
行人再识别能够实现在海量行人中根据行人特征捕获查找目标,是智能视频监控领域的关键技术。目前基于卷积神经网络的行人再识别发展迅速,众多科研人员投入其中,从数据、网络结构、损失函数等多角度展开研究。本文也从上述多角度,借鉴前人的研究成果并针对其不足之处,利用多任务学习机制进行一定的改进和创新,主要贡献如下:1.针对跨数据集学习方向,本文提出一种基于跨数据集的多任务学习方法。一方面在用训练好的模型进行跨域测试时,模型的泛化性通常较差,识别性能偏低;另一方面利用多任务学习机制的跨数据集学习的研究偏少。基于此,本文设计了一种多任务学习机制的网络模型来进行跨数据集学习,模型分为两个子分类任务,各自对两个数据集进行拟合。最后,通过实验验证了模型不仅具有很好的识别能力,还具有很强的泛化能力。2.针对人体组件模型,本文提出一种基于人体组件标签不确定性的多任务学习方法。在人体组件模型中,本文提出部分组件存在标签不确定性问题,认为前人针对人体组件模型的训练方法存在不足之处,于是创新性地设计相应的网络结构以及提出引入一种柔性标签的方法,利用多任务学习机制处理这种标签不确定性问题。最后,通过实验验证该改进方法的有效性。3.针对损失函数角度,本文提出一种基于全局距离尺度损失函数的多任务学习方法。基于距离尺度的损失函数的研究往往依靠类内或类间两两样本之间的约束,而忽略了整体性。本文则创新性地提出一种基于全局距离尺度的损失函数,利用类间距离的统计特性,更具有普遍性,它能有效防止离群点或噪声的干扰,增强模型的泛化能力。最后,利用多任务学习机制,通过设计两种网络模型进行实验,验证了该模型的有效性以及损失函数的作用。