论文部分内容阅读
随着科学与信息技术的飞速发展,现实中产生的数据量日益增多,特别是维数比较高的数据,这虽然丰富了我们的生活但也带来了前所未有的“维数灾难”问题,因此怎样有效地描述数据,已经成为一个刻不容缓的问题。特征提取被视为行之有效的方法之一,这不但可以发掘样本的本质特点,而且可以将计算量减小。本文的重点是从样本的局部和非局部几何结构着手来分析,认真从基于图论的角度来研究人脸特征提取算法的精髓;从这个角度讲,着重分析了集成局部和非局部几何结构的辨别分析特征提取算法,本文的核心内容以及研究如下:一、首先对2DPCA、2DLPP、2DLIPP三种算法分别因不能够很好地反映出非线性高维数据的内在几何结构、没有有效的利用训练样本的已知类别信息、忽略了不同类边界的判别信息等而导致过学习、泛化能力不好,分类性能不好等问题。针对以上问题,提出了二维增强监督的局部判别分析(Two-dimensional EnhancedSupervised Local Discriminant Analysis,2DESLDA)算法。它借助于设计邻接图将邻域内不同类的数据拉向它的类心,并给出了度量局部判别信息的离散度,然后结合局部数据的差异性离散度,建立了很好的鲁棒的特征提取准则。因此2DESLDA可以在低维空间保持不同类边界处的判别能力的同时,较好地保持数据的内在差异性几何结构,从而有效保持数据的局部几何结构,使算法的泛化能力得到提高,实验数据证实了该算法的合理性。二、针对2DESLDA算法不能有效地挖掘邻域外样本的辨别分析性结构,也就是说忽略了非局部几何结构,以致使算法的平稳性能下降等,提出了二维集成局部和非局部几何结构的鲁棒判别分析算法(Two-dimensional Joint Lobal andUnocal Structure Discriminant Analysis,2DJLUDA)。该算法采用三个邻接图分别描述邻域内数据的差异性结构以及邻域内、外样本之间的分类信息,进而保证邻域内样本的差异性离散度矩阵以及判别性离散度矩阵达到最大化,最小化非局部样本与自己类心之间的距离,构建了2DJLUDA算法模型。它很好地利用了数据分布的局部结构信息和非局部判别信息,所以该算法的识别性能很好,鲁棒性非常强,实验结果验证了算法性能的有效性。