论文部分内容阅读
作为模式识别领域的关键技术,特征降维的好坏直接影响分类识别的效果。特征降维的主要任务就是,在不影响数据原始信息的基础上对抽取的数据特征进行降维优化及可视化。实际中,由于数据分布情况往往很复杂,类内数据的中心互相远离,因此基于全局的特征降维方法不能取得理想效果,基于此,本文主要研究了基于局部结构的特征降维方法。首先,介绍了特征降维领域的经典方法。根据是否利用了类标信息,特征降维方法可以分为无监督方法和有监督方法。无监督的特征降维方法使得原始数据在低维流形中能够保持原有的几何关系。有监督的特征降维方法利用类标信息,对不同样本的相关性进行鉴别,因此适用于通常的分类任务。其次,针对基于全局的特征降维方法中忽略局部结构的缺陷,在Xing算法的基础上加入基于欧氏距离的局部结构信息,提出LXing算法。另外,将这一思想推广到RCA中去,提出了LRCA算法。进一步,针对NCA算法中近邻选择随机性的不足,把表示局部结构的热核函数融合到NCA中去,对样本的近邻点做了进一步的加权,提出了WNCA算法。最后,针对样本间相似度的估计只利用欧氏距离的不足,提出了基于邻域样本相似度的LPP算法,算法中计算样本间的相似度时既考虑了欧氏距离又考虑了邻域样本相似度,对样本之间的相似度进行了更为精确的估计。然后,将这种思想推广到LFDA算法中去,提出了NSS-LFDA算法。此外,把邻域类标相似度信息加入到LFDA中去,提出了NLS-LFDA算法,该算法计算样本间的相似度时既考虑了欧氏距离又考虑了邻域类标相似度,挖掘了更为丰富的局部信息。