论文部分内容阅读
行人再识别是指对于某个特定行人,在跨摄像头的环境中对该目标行人进行搜索和匹配。目前,由于深度学习和计算机视觉的快速发展,行人再识别的性能也大幅提高。然而行人再识别问题还存在很多挑战,笔者结合迁移学习、哈希学习等对行人再识别算法进行改进。主要工作和贡献如下:
①提出了一种用于行人再识别的视角混淆特征学习算法
行人再识别任务的性能会由于视角变化而严重退化。近年来,解决跨视角挑战的方法可大致划分为两类:视角通用模型和视角特定模型。然而,第一类的方法对于不同的视角变化没有足够的鲁棒性,另一类方法在实际应用中不能很好地推广。因此,笔者对两种方法进行结合,目标是在视角信息的帮助下学习视角不变的特征。提出了一个端到端的可训练的网络,称为视角混淆特征学习(View Confusion Feature Learning,VCFL),通过剔除特定视角信息的方式学习视角不变的特征。同时在三个基准数据集(包括Market1501,CUHK03,Duke-MTMC)上的实验证明了算法的方法的优越性。
②提出了一种结合视角引导注意力机制的行人再识别算法
大部分使用注意力机制的方法都是关注于其结构的设计,只有少数方法对其关注的部分进行约束。为了学习视角不变的特征同时让注意力机制更好的提升精度,尝试利用摄像头视角信息对注意力机制进行引导,从而更加关注特征图中视角不变的部分,并进一步设计多层对抗的结构,最终得到视角不变的特征。本算法在不同的注意力机制上进行实验,证明了方法中提出的视角引导注意力机制和多重对抗学习的有效性。
③提出了一种用于行人再识别的紧凑特征学习算法
行人再识别方法在准确性上有了很大的提高,但在面对快速增长的数据情况下却很少考虑匹配效率问题。于是提出使用深度哈希来支持可扩展的行人再识别。然而,简单的哈希函数会导致特征中有用的信息丢失或失真。提出了一个端到端的可训练的框架,称为内容继承的紧凑特征学习(Content Inherited Compact Feature Learning,CICFL),主要关注如何学习判别的和继承了图像内容的紧凑特征,并滤除哈希函数带来的负面影响,使准确性和效率都得到极大的提高。在Market1501、Cuhk03和Duke-MTMC三个基准数据集上的实验表明本算法在效率和准确率上的优越性。
①提出了一种用于行人再识别的视角混淆特征学习算法
行人再识别任务的性能会由于视角变化而严重退化。近年来,解决跨视角挑战的方法可大致划分为两类:视角通用模型和视角特定模型。然而,第一类的方法对于不同的视角变化没有足够的鲁棒性,另一类方法在实际应用中不能很好地推广。因此,笔者对两种方法进行结合,目标是在视角信息的帮助下学习视角不变的特征。提出了一个端到端的可训练的网络,称为视角混淆特征学习(View Confusion Feature Learning,VCFL),通过剔除特定视角信息的方式学习视角不变的特征。同时在三个基准数据集(包括Market1501,CUHK03,Duke-MTMC)上的实验证明了算法的方法的优越性。
②提出了一种结合视角引导注意力机制的行人再识别算法
大部分使用注意力机制的方法都是关注于其结构的设计,只有少数方法对其关注的部分进行约束。为了学习视角不变的特征同时让注意力机制更好的提升精度,尝试利用摄像头视角信息对注意力机制进行引导,从而更加关注特征图中视角不变的部分,并进一步设计多层对抗的结构,最终得到视角不变的特征。本算法在不同的注意力机制上进行实验,证明了方法中提出的视角引导注意力机制和多重对抗学习的有效性。
③提出了一种用于行人再识别的紧凑特征学习算法
行人再识别方法在准确性上有了很大的提高,但在面对快速增长的数据情况下却很少考虑匹配效率问题。于是提出使用深度哈希来支持可扩展的行人再识别。然而,简单的哈希函数会导致特征中有用的信息丢失或失真。提出了一个端到端的可训练的框架,称为内容继承的紧凑特征学习(Content Inherited Compact Feature Learning,CICFL),主要关注如何学习判别的和继承了图像内容的紧凑特征,并滤除哈希函数带来的负面影响,使准确性和效率都得到极大的提高。在Market1501、Cuhk03和Duke-MTMC三个基准数据集上的实验表明本算法在效率和准确率上的优越性。