论文部分内容阅读
人脸识别是模式识别和人工智能领域具有挑战性的课题之一,广泛应用于信息安全、金融安全以及公共安全,产生了巨大的经济效益和社会效益。但是,由于原始人脸图像的数据维度较高,而且在采集过程中容易受到诸如噪声、光照、遮挡、姿态等干扰,无法直接进行匹配与识别。因此,人脸表征的好坏直接影响到了后续分类的精度。如何对原始图像进行高效的表征,抽取合适的特征加以合理利用,是图像分类领域的一个核心问题。稀疏表示作为一种新兴的特征表示方法,能够有效解决实际应用中存在的信息冗余量大、计算复杂度高与可解释性差等问题,近年来广泛应用于人脸识别,成为图像分类领域的一个研究热点,大量基于稀疏表示、协同表示的人脸识别框架被提出。同时,深度学习理论的出现及其算法的迅速发展,展示了其利用大量数据对图像特征描述的优良特性,使得基于特征提取的深度学习模型成为图像识别和分类领域中的研究热点。因此,本文将以人脸识别为例,针对非限制环境下,影响人脸成像的众多内因和外因(诸如噪声、光照、遮挡、姿态),进一步研究基于协同表示和深度学习的图像分类技术,达到获取高效的图像特征表示、提升系统分类性能的目的。针对上述问题,本文深入研究和分析了基于稀疏表示、协同表示的人脸分类方法及相关改进算法,分别从分类策略改进和样本集合扩充两个方面,总结了一些经典算法的原理和过程。此外,特别关注了深度卷积神经网络、基于三维形变模型的人脸重建方法在人脸分类领域的研究与应用。在此基础上,本文提出了三种基于协同表示分类的改进算法,具体内容如下:(1)从改进分类策略、提高识别效率的角度,提出了一种使用卷积特征向量的双向协同表示分类算法(BCRC-CNN)。首先利用深度卷积神经网络从原始训练集和测试集中提取人脸特征,然后建立一个快速逆向表示模型来获取每个训练样本和从测试样本中得到的重建样本之间的辅助残差信息。其次,提供了一个双向优化问题的新的解决方案,其中,输入样本分别由正向线性组合和逆向线性组合进行双向表示。最后,提出了一种基于竞争融合的鲁棒人脸识别方法,对双向表示模型的两个残差进行加权重构。从AR、FERET、ORL等一系列知名人脸数据库中获得的实验结果验证了该方法的有效性,特别是对小样本问题的鲁棒性。(2)从改进分类策略、提高识别精度的角度,提出了一种判别性双向协同表示的图像识别算法(DB-CRC)。首先通过引入判别式字典学习模型,学习得到一个结构化字典,使得每个特定类的子字典对相关类的样本具有良好的表示能力,由此,较大的类间离散度和较小的类内离散度使得重构误差和编码系数都具有判别性。然后将学习得到的稀疏编码系数作为测试样本数据进行双向表达,建立快速逆向表示模型,利用双向表示策略估计每个测试样本与结构化字典之间的双向重构残差信息。最后利用竞争融合方法对来自双向表示模型的重构残差进行加权排名,实现最终的人脸分类。在AR、CMU-PIE、LFW等通用人脸数据库上的实验结果验证了该算法的有效性,特别是对训练样本中存在遮挡问题的鲁棒性。(3)从主动扩充样本集合、提高识别效率的角度,提出了一种基于三维形变模型的扩展协同表示分类算法(3D-ECRC)。首先将3DMM模型与字典中的2D人脸图像进行拟合,重建每张图像的三维形状和纹理,渲染得到一系列姿态变化下的虚拟正向2D人脸图像,以丰富数据库中的姿态信息。然后,将原始训练样本和虚拟样本合并构建一个扩展字典,使用深度卷积神经网络提取特征,将扩展字典和测试样本的重构过程映射到CNN特征空间。最后,基于协同表示的人脸分类算法完成分类。在FERET和LFW等公开人脸数据集上的实验结果证明了该方法的有效性,特别是针对姿态变化问题的鲁棒性。