论文部分内容阅读
深度学习技术具有强大的学习能力,但基于深度学习的方法需要学习很多模型参数,为了避免模型过拟合通常需要大量的训练样本,而这一要求在当前的人脸数据库中难以得到满足,导致与人脸问题相关的计算模型的准确率很难得到进一步提升,因此越来越多的研究者试图通过生成模型对人脸数据集进行增广,尤其是针对跨年龄、多视角人脸数据集的增广。现有的多视角人脸图像生成方法存在以下问题:(1)在训练模型时需要使用成对图像,即同一人脸多个视角的图像;(2)基于监督学习,需要大量人脸图像的视角标签,甚至需要对鼻子、眼睛、嘴巴等器官进行标注。然而,大规模成对人脸图像难以获取,且标注这些数据需要庞大的人力成本。因此,研究基于非成对图像的半监督式多视角人脸生成方法,具有重大的现实意义和应用价值。针对现有多视角人脸图像生成方法存在的问题,本文提出一种基于生成对抗网络的方法。首先,为了避免使用成对数据,通过训练编码器和判别器,使编码器学习到输入图像的身份和视角的高级抽象特征,然后将这些低维数据输入生成器,通过训练生成器和判别器,使生成器重建出逼真的人脸图像。在测试时将多个代表视角的独热编码分别强加给身份表示,利用生成器将它们分别映射成高维数据,即可在保持身份特征的同时,生成多视角图像。其次,为了减少标签的使用数量,本文在模型中使用了半监督学习,利用极少数带视角标签的图像和大量无标记图像训练模型,将编码器训练成视角分类器,使其具有人脸图像视角估计能力。当输入无标签数据时,模型的低层部分对人脸视角进行估计,并将分类结果输入生成器指导图像的重建过程,解决了传统方法需要使用大量标签训练模型的问题。基于上述工作,本文提出一种基于生成对抗网络的半监督式人脸属性识别方法。传统人脸属性识别方法需要大量标签进行训练且模型难以达到稳定,本文将所提出的基于非成对图像的半监督式多视角人脸生成模型的低层部分应用于头部姿态估计和多视角人脸性别识别,通过对抗学习,解开人脸图像中的身份表示和属性表示,并通过编码器输出属性类别,达到人脸属性识别的目的。本文对以上提出的方法进行了充分的实验。实验结果表明,本文提出的方法在使用极少量视角标签的情况下,使用非成对图像对模型进行训练,在保持人脸身份特征的同时,生成了清晰真实的多视角人脸图像。同时,在人脸属性识别任务中,使用极少量标签训练的模型成功解开了人脸身份表示和属性表示。在头部姿态估计实验中,本文方法在CAS-PEAL-R1和Pointing’04两个数据集上的精确率分别为97.0%和94.1%;在多视角人脸性别识别的实验中,本文方法在CAS-PEAL-R1数据集上的平均准确率达95.0%。