论文部分内容阅读
在海量数据时代,如何有效处理大规模数据是目前科学和工程领域亟待解决的问题。非负矩阵分解(Nonnegative Matrix Factorization,NMF)是一个有效的高维数据处理方法,从开始出现就一直呈上升态势。非负矩阵分解结合了非负约束,因此获得了基于部分的表示,也相应增强了分解结果的可解释性。非负矩阵分解算法简单、容易实现并且分解结果具有明确的物理意义,已成为海量数据分析和降维领域中重要的研究方向。本论文对现有的非负矩阵分解算法进行深入地研究和分析,并在此基础上提出了以下两种改进的非负矩阵分解方法:(一)提出了一种欧氏空间的局部非负矩阵分解(Euclidean Local Nonnegative Matrix Factorization,EU-LNMF)方法。该方法对基矩阵施加正交约束,使基矩阵的每一列尽可能相互正交,保证了分解结果的稀疏性和正交性,减小了分解误差,提高了提取局部特征的能力;同时,为了使基矩阵中具有更重要局部信息的部分保留下来,对系数矩阵也施加了约束。为了验证本文方法的有效性,将本文方法应用于人脸基图像的提取,实验结果表明,本方法相比于同类其它方法具有更好的性能。(二)提出了一种欧氏空间的增量局部非负矩阵分解(Euclidean Incremental Local Nonnegative Matrix Factorization,EU-ILNMF)方法。针对在线的大规模数据处理时,传统的非负矩阵分解方法效率不高的问题,本文对EU-LNMF进行增量形式扩展,使其可以在线处理数据。该方法只对矩阵中新增加的一列进行处理,每次只迭代系数矩阵中与新增样本相对应的一列,同时产生一个新的基矩阵。迭代过程中不必存储整个数据矩阵,且迭代部分系数矩阵,极大地减少了运算量。此外,该算法也保留了EU-LNMF中的正交约束,能够得到较好的局部特性。实验表明,本方法相对于同类方法不仅有效地减少了运算时间,而且保留了更多的局部特征。