论文部分内容阅读
人脸验证作为一种非受控、易获取的生物特征识别技术,是最常见的计算机视觉任务之一,已广泛用于视频监控、公共安全、在线支付和图像搜索等领域。传统的人脸验证算法仅提取人脸的浅层特征,对于复杂的非线性脸部表情变化,其缺乏良好的鲁棒性,无法提取稳定的人脸特征,来抵抗无约束环境下的脸部变化。得益于深度神经网络技术的迅速发展和大型人脸数据集的广泛使用,基于深度学习模型进行人脸验证的验证准确率远高于传统方法和人类目测水平。在深度学习模型性能如此优异的今天,如何能再进一步提高人脸验证模型精度性能,是当今计算机视觉学术界和工业界的研究热点和难点。损失函数是深层卷积神经网络的中枢,对整个网络的梯度优化有着导向性的作用,论文将深入研究损失函数的作用机理,并对当前的主流损失函数进行改进,使其更适合人脸验证任务的学习和训练。论文的主要工作有:(1)AM-Softmax损失函数在类间保持不变的决策边界,这意味着其对所有特征进行相同程度的惩罚,对于类内特征和类间特征,无法进行针对性判别学习。针对这个问题,提出一种聚合判别多任务学习算法,将从卷积神经网络提取的特征向量分解为两个分量,通过采用聚合类内特征任务和判别类间身份任务,进行联合监督,达到扩大类间距离同时减少类内距离的目的,获得具有内聚性的人脸特征。MNIST数据集的深度可视化实验证明了所提方法的有效性,探讨超参数、网络结构和特征规范化对验证准确率的影响。使用基于Res Net50网络的VGGFace2人脸数据集作为训练集,分别在LFW、Age DB-30和CFP-FP人脸数据集中,进行对比仿真实验。仿真实验证明,聚合判别多任务学习算法相比对比算法,人脸验证准确率均得到提高,能够提取更具有辨别力的人脸特征,对光照、姿势、表情和年龄变化,能保持较好的鲁棒性,在无约束环境下拥有良好的人脸验证性能。(2)目前来说,有三种方法可以有效提高基于深度学习技术的人脸验证模型性能,第一种方法是使用大规模和高质量的人脸数据集,第二种方法是设计更精巧的网络结构,第三种方法是针对人脸验证这个开集任务,设计判别性损失函数。受到这三种方法启发,提出一种基于改进网络结构和余弦损失的人脸验证算法。将改进后的残差模块搭建成BM-Res Net36网络,与原始Res Net36网络进行对比实验,CASIA-Web Face人脸数据集作为训练集,LFW和YTF人脸数据集作为测试集,AM-Softmax损失作为损失函数,进行两个网络的性能对比仿真实验,仿真实验证明了BM-Res Net的有效性。在YTF、CFP-FP和Age DB-30人脸数据集中,进行基准测试实验,实验结果表明,所提算法在视频人脸验证中具有良好的验证性能,在大姿态、大年龄变化中的人脸验证也具有良好的效果。