基于SIFT特征的人脸表情识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ecnuzk2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别是计算机视觉、模式识别等领域的重要研究方向,在人机交互、医疗、动画制作等产业都有很广泛的应用。因此开发一个人脸表情识别算法具有广泛的应用前景。本文主要使用Dense SIFT(Dense Scale Invariant Feature Transform即密集型尺度不变特征变换)算法提取人脸表情特征,再使用k-means聚类算法对表情特征进行聚类分析,并利用空间金字塔算法对聚类后生成的特征向量进行改进,最后利用支持向量机进行分类识别。本文的主要研究工作包括:(1)对SIFT算法的特征提取过程进行了详细的分析和研究,并研究了一种SIFT算法的简化算法,即Dense SIFT算法用于提取人脸表情特征。实验也显示Dense SIFT算法适用于人脸表情识别中。(2)研究了利用词袋模型生成一个包含一定数量单词的词典的方法。研究Dense SIFT算法在人脸图像上进行特征提取的像素点间隔分别为2,4,6,8个像素,生成的单词数分别为100,150,200,250,300,350,400,450,500,550,600时对实验结果的影响。(3)使用k-means聚类方法后得到的特征点,再用词袋模型生成代表图像特征的直方图之后,丢失了在原来人脸表情图像中的位置信息。利用空间金字塔算法,来获取聚类后得到的单词所代表的特征向量在原来图像中的整体位置信息。研究了使用空间金字塔算法前后对人脸表情识别率的影响。(4)结合SVM(支持向量机)方法,对数据库中七种人脸表情(生气,厌恶,恐惧,高兴,中性,悲伤和惊讶)进行分类识别。使用了一种自定义的核函数:直方图正交核函数。分别使用RBF(Radial Basis Function即径向基函数)核函数和直方图正交核函数对数据进行分类,并对分类结果进行比较。在JAFFE(日本女性表情库)上的实验结果表明,本文所采用的算法是有效的,最高平均识别率能达到93.333%。
其他文献
学位
矿山安全生产事关重大,提高煤炭企业安全生产信息化水平,保证煤炭安全生产和运营,是我国煤炭行业信息化建设面临的重大课题。但是当前,由于煤炭生产企业的系统自成体系,形成了复杂
基于内容的音频检索是一个新兴的研究领域,在国内外仍处于研究、探索阶段。音频信号包括语音和非语音(Non-speech)两类信号。一直以来,音频信号的处理主要集中于语音识别、说
移动Ad hoc网络是一种不需要基础设施的多跳无线网络,它由既是主机又是路由器的无线节点组成。网络中所有节点地位平等功能相同,没有中心控制节点,是完全分布式结构。移动Ad