论文部分内容阅读
随着社会信息化的快速发展,互联网上涌现出海量的人脸图像。人脸图像蕴含着丰富的个人信息,如性别、年龄、表情、种族等。这些信息在人机交互、商业推荐、安防系统等领域有着广泛的应用前景。因此,人脸属性识别研究具有重要意义与实用价值,并已成为计算机视觉领域的研究热点之一。人脸属性识别研究主要分为基于传统方法的人脸属性识别与基于深度学习的人脸属性识别。与传统的人脸属性识别方法相比,基于深度学习的人脸属性识别能自动从海量数据中学习人脸表征,获取更高层语义信息,进而提高模型的泛化性能。近年来,国内外研究者提出大量的改进方法,使人脸属性识别技术有了较大提升,但仍然面临着诸多的困难与挑战。一方面,人脸图像受光照强度、遮挡、姿态等因素的影响,对人脸特征提取造成一定的干扰;另一方面,可供研究的人脸数据集样本有限,尤其是具有准确年龄、表情、种族等属性标注的数据十分匮乏。此外,由于收集具有精确属性标记的人脸图像存在一定的困难,导致数据集中样本类别分布存在严重的不平衡。而年龄作为人脸属性识别的难点之一,其准确率有待进一步提升。因此,本文重点对人脸属性识别中的年龄估计任务进行分析研究,针对目前所存在的难点提出了具体的解决方法。本文深入讨论了基于卷积神经网络的人脸年龄分类算法,针对人脸数据集中样本类别不平衡问题,提出了一种基于卷积神经网络的多分类Focal Loss的人脸年龄分类算法。该方法基于Focal Loss将其用于多分类任务,以克服类别不平衡对年龄多分类结果的影响。多分类Focal Loss的主要思想是通过重新调整标准交叉熵损失,降低易分类样本的权重,使模型集中训练难分类样本,从而解决类别不平衡问题。然后基于多分类Focal Loss采用不同深度的卷积神经网络对人脸图像进行多次实验,选择合适的归一化方法与Dropout保留概率,对比不同深度的模型对年龄分类性能的影响。使用Adience数据集进行训练与测试,实验结果表明基于多分类Focal Loss的人脸年龄分类算法能有效解决类别不平衡问题,进一步提高人脸年龄分类准确率。为了缓解数据集有限问题,本文基于多任务学习对性别与年龄进行分类研究,使用MORPH数据集进行训练与测试。实验结果表明基于多任务学习能有效降低训练冗余度,并使单一属性的性能得以提升。