论文部分内容阅读
《Nature》在1999年刊登了两位科学家Lee和Seung对数学中非负矩阵研究的突出成果.该文提出了一种新的矩阵分解思想——非负矩阵分解(Non-negativeMatrix Factorization,NMF)算法,即NMF是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法.由于非负矩阵分解在现实生活中有着广泛的应用,该论文的发表迅速引起了一些研究领域中的科学研究人员的重视:一方面,科学研究中的很多大规模数据的分析方法需要通过矩阵形式进行有效处理,而NMF思想则为人类处理大规模数据提供了一种新的途径;另一方面,NMF分解算法相较于传统的一些算法而言,具有实现上的简便性、分解形式和分解结果上的可解释性,以及占用存储空间少等诸多优点.在[2]中,C.Boutsidisa和E.Gallopoulos提出了一种基于奇异值分解(SVD)的非负矩阵分解的初始化策略.在这种策略下,和原来未经过初始化的非负矩阵分解的算法相比较,收敛速度得到了很大的提高.对于一个大型的非负矩阵,我们可以利用Lanczos双对角化得到其一个低秩近似;正如[2]所应用的方法一样,我们可以进一步得到它的非负近似.由此我们得到了非负矩阵分解一种新的初始化方法;它虽然带有一点随意性,但是可以和现存的非负矩阵分解算法相结合.从数值实验可以看出,和基于奇异值分解的[2]初始化算法相比,这种新的初始化算法效果更好.本文主要由5部分构成.第一部分,我们介绍了非负矩阵分解和非负矩阵分解初始化的一些背景,以及前人做的一些贡献.第二部分,我们回顾了Lanczos双对角化过程,并得到一个低秩的近似.第三部分,我们介绍了我们的策略:从Lanczos双对角化过程中得到矩阵的非负近似,即初始化的(W,H).第四部分,我们做了一些实验,与C.Boutsidis和E.Gallopoulous的方法作了比较,说明了我们方法的优势.第五部分,我们对我们的论文做了一个总结。