论文部分内容阅读
随着科学技术的不断发展,计算机越来越成为人们日常生活中不可或缺的必备品,而智能交互技术也同时得到了快速的发展。人与人之间的沟通可以通过语言、肢体动作和表情等,那么机器如何在非语言交流的情况下与人类之间建立有效的沟通便成为一个必须要面对的问题。在非语言交流下,一个人的表情是其内心状态的真实反映,因此,人类可以通过观察对方的面部表情,从而了解其内心的情感状态,以此来达到沟通的目的。若机器具有识别人类面部表情的能力,则也可以和人类之间建立有效的沟通方式。表情识别是指通过一定的技术,对人类当下的面部表情状态进行捕捉,并对其进行分析,从而识别出其表情所属的类别。表情识别的过程主要包括三个步骤,即对图像的预处理、特征提取和表情分类。预处理主要是指对表情图像进行各种归一化处理,而特征提取和表情分类两个过程是人脸表情识别过程中比较重要的部分,所提取的面部特征的有效与否直接决定着表情的分类准确度,而一个好的表情分类方法,也对正确识别表情起着决定性的作用。现有的表情识别方法中,大多是针对静态图像进行识别,这部分内容的相关技术已经比较成熟,可以达到较高的识别率。本文中,将尝试对视频中的人脸表情进行识别,在特征提取阶段,基于Gabor变换,分别提出两种不同的处理方法对图像特征进行提取,即根据面部表情中各个子区域的重要程度,选取部分子区域进行特征提取和将人脸均等划分,分别添加不同的权值系数,再进行特征提取,使用这两种方法提取特征后,再分别使用神经网络和SVM的分类方法进行分类,通过实验对比,说明本文所使用的方法的有效性,以及其在特征提取方面的优势。在表情识别阶段,基于对具有时域特性的隐马尔可夫模型的学习与研究,提出一种三层结构的HMM模型,使用该模型作为图像序列的表情识别方法,并通过实验,验证了该方法在表情分类方面的有效性,探索了其在其他方面的模式识别领域的应用。