论文部分内容阅读
表情识别是理解情感的基础,是智能化人机交互所要解决的一个重要课题,也是人们探索智能、理解智能的有效途径。由于人脸表情本身的多样性和非线性特点,用线性处理方法很难获得令人满意的识别结果。本文主要对基于流形学习的人脸表情特征提取方法进行了研究,目标是解决监督学习中小样本情况下的识别问题和半监督学习中有标记样本数量有限情况下的识别问题,论文的主要贡献如下:第一,将基于线的相似度度量(最近特征线)引入流形学习准则,构建基于线的近邻图,提出了模糊局部最近特征线算法(FLNFL)。不同于传统的近邻图,特征线图中的每个“顶点”不是孤立的样本点,而是由同类别的样本点构成的特征线。特征线能够逼近样本间可能出现的变化,等同于模拟出无穷多个特征点,样本集的表示能力便因此增强了。此外,采用模糊方法计算样本的类隶属度和权重矩阵,从而减弱了相似样本之间的混叠,准确的刻画样本的内在关系。实验结果表明FLNFL可以有效的提取人脸表情特征,提高人脸表情识别的准确度。特别是在规模较小的JAFFE表情库上,FLNFL算法的优势更为明显。第二,分析了最短特征线段分类器的优势和不足,提出了一种新的基于线的相似度度量,称为改进的最短特征线段。该度量方法将最近特征线和最短特征线段相融合,避免了二者的缺点,同时保留了扩大样本表示容量的优势。将这种新的度量方法用于构建邻域图,并结合判别分析的思想提出了图保持最短特征线段算法(GSFLS)。实验证明,相比基于最近特征线度量的特征提取算法,GSFLS提取出的人脸表情特征判别性更强。第三,传统的基于图的半监督流形算法利用有标记样本挖掘类别结构,大量的无标记样本用于捕获数据集的流形拓扑结构,其潜在的类别信息被忽略了,该信息对获得数据集的判别性结构大有帮助。当有标记样本的数量较少时,得到的对类别结构的刻画是不准确的,导致算法的性能严重退化。为了解决上述问题,提出了概率半监督判别分析算法(PSDA)。该方法构建了类重建误差与类别信息的非线性函数关系,并引入模糊化思想,估计无标记样本的类隶属度。在类隶属度的指导下,大量无标记数据可以辅助标记样本对数据集的分布进行更加准确的描述。实验结果表明这种分配方式更适合表示由于内在的(如混合表情)或外部环境变化造成的类别不确定的表情样本,逼近样本集的内在结构。对于提高人脸表情识别的正确率效果显著。第四,在PSDA算法的基础上,提出了其流形拓广算法——图嵌入概率判别分析(GPSDA)。首先给出模糊集的相似度定义,用于度量无标记样本的模糊类别信息之间的相似关系。其次,结合类别关系和邻域关系构建监督的邻域图和邻接矩阵。相比已有的半监督流形算法,构建的监督邻域图在挖掘数据集的整体几何结构的同时,提高了算法的判别能力。最后,采用判别分析思想构建目标函数。实验表明,GPSDA对人脸识别和表情识别比其他相关的半监督流形学习方法更加有效,并且对有标记训练样本不足时的识别问题具有一定的鲁棒性。