论文部分内容阅读
近年来,随着人工智能技术的迅猛发展,人们对类似于人和人交流方式的人机交互的需求日益强烈。人脸表情识别作为生物特征识别中的一种,是人机交互中不可缺少的一部分。尽管该技术已经取得了不少的进展,但依然存在实时性差,分类正确率偏低等问题,要实现大规模的应用仍需进一步研究。本文以人脸表情识别为研究目标,在充分研究了各类算法的基础上,探究并改进了新的算法,从而有效提高了表情识别率和执行速度。论文的主要工作包括以下三个方面:研究了基于粗糙集改进的有约束的LLE流形算法,本文根据LLE流形算法设计了一种基于粗糙集的有约束机制,并在实验中验证了这种约束能够有效的进一步降低维数,从而避免了LLE算法提取的特征仍有数据冗余的缺陷。在JJAFFE表情库的实验结果显示,本文研究的改进算法,在人脸表情的七种分类中,平均准确率可达87.38%,比LLE算法的平均准确率高出5.95%。研究了非下采样Contourlet变换在人脸表情识别中的应用,并设计了相应的算法流程。首先将人脸表情图像分割为最能表征表情信息的眼睛和嘴巴两个部分,然后利用非下采样Contourlet变换对分割的局部图像进行特征提取,最后使用极限学习机进行分类,并与BP神经网络进行对照实验。研究结果显示,表情分类平均准确率可达86.57%,比BP神经网络的分类方法平均准确率高出7.43%。而在执行速度方法,极限学习机却是BP神经网络的11.09倍,表明了本实验方案的高效性和可行性。研究了基于视觉词袋模型的人脸表情识别算法,本算法的创新点是不同于传统的将整幅图像的SIFT特征都作为视觉词典的方法,而是基于感兴趣区域的理念,只使用最能表征表情信息的眼睛和嘴巴来生成视觉词典,这样就大大提高了表情分类正确率。最后使用线性支持向量机Liblinear来进行分类。实验结果表明,本算法在JAFFE表情库上的平均率可达94.28%,比支持向量机高出5.33%,而运行一次的平均时间仅为0.11s,比非线性支持向量机缩短了68倍;在CK表情库上的平均正确率可达93.36%,比非线性支持向量机高出2.93%,而运行一次的平均速度则提高了14.25倍,证明了该算法的可泛化性和高效性。