论文部分内容阅读
子空间方法是一种根据应用需要对高维数据进行降维处理的方法。它寻找一种线性变换将高维的数据投影到低维的子空间中去以达到降维的目的。这种方法在对高维数据进行处理时表现很好且应用广泛,比如人脸识别,文本分类,DNA序列分类及相应的功能预测。主分量分析以及线性判别分析就是最常用的子空间方法。本文对子空间方法的最近发展进行了综述。在使用线性判别分析处理高维数据时,经常会碰到所谓的小样本问题,也就是线性判别分析的类内离散度矩阵是奇异的。本文对这个问题进行了深入研究并提出了新的算法。由于子空间方法属于一种线性变换,为了处理非线性的情况,比如分类面是非线性的,子空间方法的核扩展被提了出来,常见的有核主分量分析以及核Fisher判别分析。本文在分析算法的核扩展的基础上提出了核扩展的判定条件以及核方法的等价性。主要的工作可以归纳如下:
·对子空间方法的传统算法及其发展进行了综述。包括稀疏PCA,二维子空间方法,子空间方法的核扩展以及子空间方法的非线性对应算法流形学习。
·针对线性判别分析中的小样本问题,我们提出了一个统一的框架,即加权投影方式。通过这个框架可以统一已有的针对小样本问题提出的几种方法,包括主分量分析加线性判别分析的二阶段法,基于零空间的线性判别分析,贝叶斯人脸识别算法。同时,我们也提出了一种参数化的加权投影方式,前面提到的三种算法都可以看做它的特例。通过在人脸识别这个典型的小样本问题上的实验我们验证了该算法的有效性。
·在分析了算法的核扩展的基础上,提出了解决算法核扩展的两个关键问题的方式。首先是新的核扩展的判定条件。此判定条件是对算法核扩展的本质的描述,不为算法的具体表达所限制。随后,我们提出了算法的核扩展与核主分量分析加上作用于特征空间的算法这两种方式的等价性。这可以看成是算法核扩展的一种新的方式。实验表明这种等价性不只是在理论上是正确的,在实际的计算过程中也能够反映出来。