论文部分内容阅读
随着媒体和社交网络的发展,人脸年龄与性别识别在现实生活中的应用越来越多,吸引了广泛的研究兴趣。由于人脸图像的生物特征识别是非接触的,比较简单快速,还具有一定的娱乐性,在社交网络、视频监控、人机交互等领域具有广阔的应用前景。本文主要研究了人脸检测方法,以及人脸年龄与性别识别方法,并分别提出两种解决方案,以适应不同的应用场景。第一种方案,使用Faster R-CNN算法进行人脸检测,提取人脸的CNN特征进行训练和测试。第二种方案,使用基于比例特征和Adaboost算法进行人脸检测,提取图像的LBP特征作为人脸特征。上述两种方案提取特征之后,均使用随机森林进行训练和测试,具体内容如下:(1)第一种方案,由于Faster R-CNN算法在各个目标检测数据集上取得惊人的成绩,因此本文在WIDER大规模人脸数据集上,训练一个Faster R-CNN模型进行人脸检测,并在FDDB数据库上对该模型进行评估,结果表明该算法有较高的人脸检测率。为了提高在非限制性环境下对人脸年龄与性别的识别准确率,本文提出一种基于深度卷积神经网络的人脸特征提取方法,使用"一般到特殊"的微调方案。首先采用在大规模数据集上进行人脸识别预训练得到的VGG-Face模型;接着使用该模型在CelebA人脸属性数据集上,对选取的5个特定的属性进行微调训练,得到人脸属性模型,这几个属性分别是:①是否留胡子,②是否年轻,③是否戴眼镜,④性别是否为男,⑤是否戴帽子。将所有全连接层的输出值连接起来,构成一个向量,作为人脸特征;最后使用随机森林分类器,在Adience数据集上训练和测试。实验结果表明,该方法的分类准确率较高,提取的人脸CNN特征具有鲁棒性。(2)第二种方案,提出基于比例特征和Adaboost的人脸检测算法,然后提取图像LBP直方图作为人脸特征向量。具体的,本文提出的比例特征,描述的是图像中任意两个点的比例关系,它具有尺度不变性,有界性等特点。本文使用深度二次树去学习比例特征及其组合的最优子集,使得人脸不同部位可以通过学习的规则被分割,再使用一个soft-cascade级联结构的分类器对滑动窗口进行分类,检测人脸位置。接着,本文使用图像分块的方法,分别提取各级人脸图像的LBP直方图特征,并使用随机森林算法进行训练和测试。该方法的实验结果跟上述基于人脸CNN特征的分类方法相比,准确率要低一些。