论文部分内容阅读
传统的人脸识别方法多采用浅层的结构提取人脸图像特征。这类方法提取人脸图像内涵特征的能力有限,其识别效果也难令人满意。随着认知科学和脑科学的发展,为深层网络技术提供了新的视角和思路。人们模拟人脑分层特征表达的结构,提出了多种深层网络模型。深层网络采用非线性、多层网络的结构,逐层提取人脸图像的特征,该类方法提取的特征具有更强的抽象性和判别力,适用于复杂的分类问题。深度学习自提出以来,便吸引了众多研究学者的关注,成为了模式识别领域的一颗新星。本文将深度学习技术应用于人脸识别,进行了以下三项工作:1.人脸姿态估测在人脸识别和人机交互中均有广泛的应用。鉴于梯度特征能够很好地描述不同姿态图像的差异,本文以灰度特征和梯度特征的组合特征为输入来训练DBN网络实现了人脸姿态的分类。本文构建了三层的深度信念网络(Deep Belief Network, DBN)模型,并对网络参数进行训练。在CAS-PEAL-R1人脸数据库上进行姿态分类实验,实验结果表明,与常规单一地使用灰度特征为输入进行深度学习的方法相比,使用灰度和灰度差的组合特征为输入取得了更优的识别效果。2.本文分析了图像灰度特征、LBP (Local Binary Pattern, LBP)特征和梯度特征在人脸表达上的优缺点,并将这三种互补性的特征进行融合,提取更具鲁棒性的特征。首先分别提取人脸图像的灰度特征、LBP特征和梯度特征,然后构建三种卷积神经网络(Convolutional Neural Network, CNN)分别对灰度特征、LBP特征和梯度特征进行降维,提取更具判别力的特征,最后将这三种更具判别力的特征进行串接,并通过PCA算法进行降维、融合。在LFW人脸数据库上进行交叉验证实验,实验结果表明,与基于单特征单网络的特征提取方法相比,基于多特征多网络的特征构建方法具有更好的识别效果。3.本文提出了一种以减小类内特征波动范围为优化目标的CNN网络微调方法。在与训练集CAS-WebFace人脸数据库不重叠的LFW人脸数据库和YTF人脸数据库上进行测试,其等误差识别率分别提高了6.50%、4.04%。测试实验表明经过微调的CNN网络具有更强的泛化能力。