论文部分内容阅读
进入二十一世纪的第二个十年以来,人工智能技术开始了蓬勃的发展。其中,人脸识别技术因为在安保、金融、电子政务、娱乐等多个领域具有广泛的应用场景和极具潜力的发展空间,因而成为了人工智能技术中的热点研究课题。然而人脸图像极易受到人脸表情、姿态、光照、附属物等影响,这些因素使人脸图像具有极大的多变性,增加了人脸识别的难度,对算法提出了更高的要求。解决人脸识别问题可以分为四个步骤:人脸检测,人脸规范化,人脸特征提取,特征匹配。本文分别对这四个步骤设计实现了不同算法:基于级联集成回归树的人脸检测,基于仿射变换的人脸规范化,基于Inception层的神经网络模型的人脸特征提取,基于SVM分类器的特征匹配。第一,在人脸图像检测阶段提出使用级联集成回归树算法。因为一方面在预测人脸形状时需要可靠的特征,另一方面,提取特征时需要一个准确的人脸形状估计,所以需要迭代地进行人脸检测过程,即使用级联的思想。该算法级联了多个强回归器,每个强回归器又是由若干个弱分类器组成。每一个强回归器都是一个残差回归树,在树的每一个叶子节点上都存储着一个残差的回归量,当输入的值落入到一个节点上时,就将残差值加到该输入上,这样就起到了回归的目的。最终当所有的残差加在一起之后,就实现了人脸检测的目的,即返回包含人脸面部特征点的框盒图。最后设计实验证明了算法的有效性,设计了对比实验证明了算法的先进性。第二,使用仿射变换对人脸图像进行了规范化处理,把人脸图像矫正为面向摄像机方向,裁剪图像尺寸为标准的输入神经网络的尺寸。统一标准化了进入后续特征提取器的输入图像,减少了不必要的图像噪声影响。第三,在特征提取阶段,设计了利用三元损失函数训练了基于Inception层的神经网络模型的特征提取器。三元损失函数可以让同一个人的人脸图像尽可能地在高维特征空间中聚集,同时让不同人的人脸图像离得尽可能远。而Inception层比神经网络模型中常用的全连接层和卷积层具有更高的分类准确度和更少的参数。训练后神经网络将人脸映射到一个128维单位超球空间,即从每一个人脸表提取128维特征向量。设计了人脸对比实验,显示与学术界的前沿模型FaceNet相比,本文提出的模型降低了约4%的准确度,但是缩减了约56%的参数数量。第四,基于SVM分类器进行特征匹配。设计了双人人脸识别实验证明了本文算法的有效性。然后设计了对比实验,与基于PCA降维的Eigenfaces,基于LDA线性判别分析的Fisherfaces,基于局部二值模式直方图的LBPH三种技术方法进行了同步对比。结果显示本文准确率均高于上述系统。