论文部分内容阅读
随着人工智能时代的到来,人机交互将成为未来生活中一个十分重要的部分。如何让计算机识别人类的情感成了人机交互中的重要研究课题。表情能够反映人类的内心情感,在人们的日常互动中有着举足轻重的地位,如何通过识别人脸表情从而赋予机器理解情感的能力将成为未来人机交互领域的研究趋势。目前已有很多研究者对表情识别进行了研究,也涌现了大量的研究成果。但是由于人脸表情存在个体差异,如人们不同的文化背景、肤色等,表情识别算法的结果往往不够理想;其次由于人脸图片拍摄角度的不同,也会一定程度上降低表情识别的精度;另外现有的表情数据库还存在数目较少、数据采集困难、标注的成本较大等问题,也会影响表情识别的效果。因此,如何提高表情识别模型的精度以及泛化能力,对实际应用下的表情识别仍然具有重要意义。本文从以下两个方面开展了表情识别技术的研究。第一,本文探索了基于人脸特征点的表情识别技术途径。这样的选择是基于以下考虑:首先,利用人脸特征点可以排除肤色,光照等的影响,有可能得到更加鲁棒的识别效果;其次,基于目前成熟的人脸特征点提取技术,能够设计出基于此的更加简单的神经网络结构,提高识别速度;最后,本文试图探索这样一个有趣的问题,即“只根据人脸特征点的几何变化能否达到类似人类的表情识别水平?”第二,由于面部特征在人脸表情识别方面至关重要,面部特征的提取往往需要深入的设计和广泛的调整。本文探索利用已有的训练好的优秀网络,通过迁移学习来进行人脸表情识别。本文的主要工作内容总结如下:(1)提出了一种基于常用的68个特征点坐标的人脸表情识别算法,由于特征点数据量比较少,经广泛尝试多种不同的网络结构后,发现仅含有2个隐藏层的人工神经网络便可以达到较优的识别水平。CK+和KDEF数据集上的实验结果显示,该算法能达到与具有代表性算法相接近的识别准确率,且有着更快的识别速度。实验结果也表明该算法对不同数据集有着良好的泛化能力,对光照有着较好的鲁棒性。(2)基于工作(1),由于面部表情识别算法仅用面部特征点只能达到有限的识别水平,为了进一步提高算法的识别能力,往往还需要提取更复杂的特征,本文第二部分的工作内容采用了迁移学习来提取特征。由于在大规模数据集上训练好的网络有着良好的特征提取能力,本文基于预训练模型VGG19提出了基于多特征融合的表情识别算法。本文算法中广泛尝试了多种融合策略,将人脸局部区域的特征与人脸全局特征进行了融合。该算法在CK+和KDEF数据集上的实验结果表明,将人脸全局特征与嘴巴局部区域特征相融合后,经支持向量机分类后达到了较优的识别水平。