论文部分内容阅读
随着新信息技术和多媒体的发展,人机交互(human-computer interaction)方式得到了本质的改进,它不再仅仅依赖于键盘、鼠标和显示器这些传统的计算机外部设备,而是更多地基于多媒体方式如图像和视频,从而变得更加高效,界面也更加友好。表情是一种人类用以表达情感进行交流的有效手段,使计算机能够按照人类的思维方式认知表情(人脸表情识别)成为人机交互的重要途径。人脸表情识别是一个涉及心理学、生物信息科学、图像处理、计算机视觉、模式识别和机器学习等领域的交叉学科,自20世纪80年代问世以来受到了广泛关注。由于人脸图像非常复杂,表情识别需要排除位置、光照、角度和不同人脸特征的干扰,因此出现了大量人脸检测和定位、表情特征提取和分类的经典算法,也得到了比较理想的效果。本文在详细研究这些算法的基础上,结合数据优化领域的粒子群优化算法,提出了基于统计特征提取和优化算法的人脸表情识别方法。本方法充分利用了小波变换多方向多分辨率的优势,统计特征提取算法较低的运算复杂度和粒子群优化算法高效的优化能力。本文以表情识别为研究对象,重点介绍表情特征的提取和优化过程的理论。具体来讲,主要包含如下几方面的内容:1.介绍课题背景和研究意义,简要描述计算机视觉、模式识别领域的基本理论和主要算法。同时介绍人脸表情识别技术的研究背景和发展现状,进一步分析表情识别系统的组成和各个部分的实现方法及其特点。2.在前述工作的基础上,本文主要提出新型算法,具体来讲就是首先使用小波变换降低表情图像的数据量,保留有益于表情识别的频率成分,如脸部轮廓和眼、眉、鼻、口等表情特征部位的细节信息,然后运用具有统计特性的分析方法-主成分分析和线性判别分析以及它们的二维扩展对表情数据进行降维和特征提取,进一步使用粒子群优化算法与它的改进形式进行特征优化,去除表情识别不利因素的影响,最后按照所得表情特征使用最近邻聚类方法对其进行分类。在日本JAFEE表情库上的仿真实验得到了较好的结果,相比其他方法能够得到更好的识别效果3.对所做工作进行总结,明确下一步的研究方向,研究重心逐渐过度到半监督学习和无监督学习的表情识别上来,并进一步探索微表情处理、混合表情等非基本表情的研究领域。