论文部分内容阅读
局部线性嵌入(LocallyLinearEmbedding,简称LLE)是一种较好的非线性降维方法,这种方法对于位于某种非线性流形上的数据的降维有着比较好的效果.但是这种方法对于其中一个重要参数——近邻个数,太过敏感.本文将另一种非线性降维方法Conformal-Isomap中的一种度量数据之间距离的方法引入到LLE方法中.经过实验发现,新引入的距离对于近邻个数的选择有比较好的效果,可以使得实验的结果对近邻个数的选择不那么敏感.一般而言,改进后的LLE算法在近邻个数K的取值比较小的时候就可以得到良好的效果,而原始的LLE算法要达到相同的效果,近邻个数K的取值通常要大很多.通过分析,我们发现新引入的距离度量并没有增加LLE算法的算法复杂度,而LLE算法的算法复杂度是同近邻个数K相关的,因此,在取得相同较好效果时,改进后的LLE算法所需的开销比原始的LLE算法要低.同时,本文还将LLE方法同主成份分析(PCA)方法相结合,先用LLE方法将高维空间中的数据降到一个相对较低的空间中,这样可以保持原始空间中的非线性结构不变,然后再用PCA降到我们所期望的维数,去掉一些噪声信息的影响,保留方差较大的变量,使得有用信息尽量保留.通过实验发现,这种相结合的方法可以取得较好的效果,它比直接用PCA降维或只用LLE降维所取得的效果都要好.