论文部分内容阅读
特征提取是模式识别的基本步骤之一,其实质是将高维数据映射到低维特征子空间中以更好地完成分类任务。在过去的一些年里,诞生了一些经典的特征提取方法,如主成分分析(PCA)、线性判别分析(LDA)等。然而这些方法更多地应用于呈线性分布的数据集,对于非线性结构的数据集降维效果并不理想。作为非线性降维方法的流形学习(Manifold Learning),能够有效发掘非线性数据的内蕴特征,因而受到研究者们的广泛关注。目前一些成熟的流形学习算法多是无监督降维方法,不考虑样本潜在的类别信息。实际中,当样本具有先验类别标记时,可以在无监督流形学习方法中融合类别信息,提升分类性能。本文尝试对无监督流形学习方法进行监督化拓展,并用于人脸图像的特征提取,主要做了以下几点工作:1.结合流形学习方法融合样本类别信息的两种主要方式:基于图嵌入的方式和基于类散度的方式,对局部保持投影算法(LPP)进行监督化拓展,提出了最大类间相斥的局部保持投影(MRLPP)。该算法能够使样本从高维空间投影至低维特征空间后,类内数据点保持紧凑,各类中心则相斥远离,从而带动异类样本的分散,达到较LPP更好的分类性能。2.基于稀疏表示投影(SPP)能够自觉地捕捉样本“局部”结构且具有自然鉴别的特性,本文进一步对其进行监督化拓展,提出了监督稀疏保持投影(SSPP)。SSPP最小化由类内样本重建所引起的误差,同时最大化由类间样本重建所引起的误差,旨在保持同类样本之间的相似性,扩大异类样本之间的差异性。3.针对SPP在对一些特殊样本(如受光照、表情、姿态等影响的人脸图像)进行降维时,忽略了样本空间存在的流形结构,本文设计了一种融合样本流形信息的降维方法:稀疏鉴别嵌入(SDE)。SDE在保持全局样本稀疏重构关系不变的同时,尽可能地保留了样本的局部结构。该算法可用于人脸图像特征提取,并能够取得良好的识别效果。