论文部分内容阅读
人脸识别是计算机视觉领域中一项重要研究课题,该研究的目的是通过采集人脸特征信息实现身份识别和验证。目前,这项技术已经在国防安全、社会稳定等领域得到广泛应用。人脸关键点检测是人脸识别中的一个重要步骤,其检测精度直接影响到人脸识别的效果。此外,人脸关键点坐标为表情分析和识别提供重要的几何信息,面部表情能传达出人们的喜怒哀乐和悲欢离合,而人脸关键点坐标和坐标之间的关系可以辅助识别人脸表情。人脸关键点检测就是自动检测人脸图像中比较显著区域的特征点,如鼻子、嘴巴等器官以及人脸轮廓等,这是一项在人脸检测基础上进行的研究。随着计算机视觉的发展,这项检测技术已经成为一项独立的研究方向,并日趋成熟。人脸关键点检测实现是一项比较复杂的过程,特别是在复杂的自然场景下,光照、人脸肤色、人脸姿势、遮挡物以及其他附属物如眼镜等因素都给关键点检测带来严峻的考验。为了降低检测的难度,在图像预处理过程中,人们通常首先会对人脸图像做降噪处理,然后再对人脸图像做归一化处理等。当前流行着多种人脸关键点检测算法。其中,ASM(Active Shape Model,主动形状模型)是最经典的人脸关键点检测算法之一。ASM是一种基于点分布模型(Points Distribution Model,PDM)的特征点提取算法。此后,很多学者围绕着ASM提出的一些改进方法,目前,这些方法已经在一定程度上取得了优异的成绩。但是这种算法比较依赖初始化形状模型。随机森林是一种用于数据回归和分类的集成学习方法。在做数据分类和回归时,随机森林具有检测精度高、训练速度快、丢失一些特征不影响检测效果等优势。人们常用随机森林训练图像特征或与其他算法结合来实现提高关键点检测精度。但是,随机森林在某些噪音相对比较大的分类或者回归问题上会产生过度拟合,造成检测效果不佳。因此,为了进一步提高人脸关键点检测的精度,本文提出了将梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和人脸图像特征相结合的方法。其中,GBDT是一种用于解决回归和分类问题的机器学习技术,该算法产生一个由多个弱分类器集成预测模型。GBDT的迭代过程和Boosting中的类似,但是GBDT可以优化可微分的损失函数。本文通过使用GBDT进行大规模地训练HOG、LBP、Gabor特征以及它们的融合和级联特征,找出检测效果最佳的特征和最佳参数。实验证明HOG特征是本文的最佳特征,即H-GBDT算法检测效果最佳。然后将H-GBDT算法与SO-RF、Face++进行实验对比分析,以证明本文H-GBDT算法具有更好检测精度,特别是在正脸数据集上。论文的主要贡献如下:1.提出一种基于GBDT和HOG特征人脸关键点检测算法。2.标注2000张LFW数据集图像,每张图像包含20个关键点,关键点坐标的位置意义与BioID数据集中的相同。3.在BioID、LFPW和LFW三种数据集上提取Gabor、LBP、HOG以及它们的融合特征或级联特征,并对这些特征进行大规模地实验。实验验证对GBDT来说HOG特征是最佳特征,将H-GBDT的关键点检测结果和SO-RF、Face++两种算法结果相比较。本文算法在所有数据集上将检测误差控制在了5%以内,特别在Bio ID数据集上,误差基本上可控制在3%以内。此外,本文算法易于理解和实现的优点。