基于矩阵分解理论学习的数据降维算法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:liuhuayu0472
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,科研工作中经常会遇到大量的高维数据。例如图像检索、模式识别、人类基因分布、特征分类等。为了便于数据分析和探测数据的内部结构,通常采用数据降维的方法。数据降维的目的是要找出隐藏在高维数据中的低维流形结构。由于矩阵是数据全部信息的体现,为了更精准地探究数据的内部结构的变化,采用数学方法是有必要的。矩阵分解理论尤其是以二维矩阵的分解和张量的分解的学习是近年来出现在人工智能领域中的一种重要方法,并且在探索数据降维方面取得了令人瞩目的成果。近年来,出现了许多有效的基于流形学习的数据降维方法。主要包括主成分分析(PCA)、局部线性嵌入(LLE)、线性差别分析(LDA)、和近邻保留嵌入(NPE)等。这些算法都是典型的一维数据降维方法,并且已经广泛的应用于数据降维、模式识别及特征提取等领域。一维数据降维方法只能处理向量化的数据,数据的向量化过程会导致部分有用的信息丢失,而且高维数据的向量化表示会引发维数灾,导致计算复杂程度加大。这些事一维算法所面临的问题。目前,科研工作者针对这一类问题,以矩阵分解理论为基础,抽象出采用二维矩阵分解和张量分解的数据降维思想,并提出了许多有效的基于矩阵分解理论学习的数据降维方法。主要包括二维主成分分析(2D-PCA)、二维线性差别分析(2D-LDA)、张量局部差异分析(TLDE)、以及张量子空间分析(TSA)等。本文以矩阵分解原理为基础,全面的分析了现有的数据降维方法,并总结出数据降维算法理论中的重要原理,重点研究了NPE算法并对其进行了修正改进。本文的主要工作包括:(1)从矩阵的奇异值分解和张量的高阶奇异值分解两个方面,结合张量子空间分析(TSA)和张量近邻保留嵌入(TNPE)两个算法,研究矩阵分解理论与降维的结合及应用原理。(2)近邻保留嵌入(NPE)作为一种降维算法,需要先进行矩阵向量化,但是原始数据(图像矩阵)的维数通常过大,容易造成一些有用的信息丢失,不能充分的反映原始数据内部的几何拓扑特征。针对这一缺点,我们提出了一种基于矩阵分解理论学习的算法——二维近邻保留嵌入(2D-NPE)。
其他文献
近年来,随着分布式系统的广泛应用,带来了许多亟需解决的问题,如何设计相应的策略来求解对应的分布式优化问题,迫在眉睫。本论文主要围绕分布式凸优化算法的求解速率问题来展
光子晶体被称作光子领域的半导体,因其周期性结构而产生的光子禁带特性和控光理论,光子晶体在光通信中具有广阔的应用前景,被认为是最有可能实现集成光路的材料。基于光子晶
在过去的几年中,一些非随机化的技术被引入带有敏感问题的抽样调查以协助调查者获得尽可能真实的信息.然而,诸如十字交叉模型、三角模型、隐藏敏感性(HS)模型和多分类三角模型
Burgers方程是一个双曲-抛物型方程,它描述物理问题的对流和耗散的综合过程,它兼有一阶波动方程和热传导方程的特性Burgers方程也可以作为Navier-stokes方程的特例.因此,对Bu
学位
分形插值函数是美国数学家M.F.Balnsley于1986年首先提出来的,它为数据拟合提供了一种新的插值方法。近年来,分形插值方法在许多实际应用领域得到了越来越广泛的应用。本文主要
学位