非负矩阵分解算法研究及其应用

来源 :福建师范大学 | 被引量 : 0次 | 上传用户:ospriteo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,数据的规模越来越庞大,数据的相关性也变得越来越复杂,譬如:越来越高分辨率的监控视频、图像,错综复杂的关系网络等.因此对大数据的处理变得重要而迫切.矩阵的低秩逼近是一种大规模数据矩阵低秩近似表示技术,从而可实现矩阵的降维.非负矩阵分解(Nonnegative Matrix Factorization,NMF)是矩阵的低秩逼近方法之一,它将一个给定的非负矩阵分解成两个低秩的非负矩阵的乘积,从而可得到所给非负矩阵的低秩逼近.这样的分解得到的非负数据可解释性强,在实际应用领域有较好的物理意义.自从NMF算法的思想被提出后,很多NMF算法被提出并被应用于实际应用领域.在前人研究的基础上,本文主要研究了几种新的NMF算法并将之应用于图像处理和复杂网络社区发现领域,其中图像数据的处理解决图像重构、图像共性特征提取等问题,而对复杂社区网络数据着重解决重叠社区发现的问题.论文结构如下:绪论部分先介绍了 NMF的研究背景和意义,然后根据NMF算法分类,按时间先后顺序详细阐述了 NMF的国内外研究现状、发展趋势和存在的问题及不足,最后对本文的主要工作和组织结构作了概括说明.第1章主要介绍了NMF的相关知识和几种经典的NMF算法.第2章针对NMF中的牛顿型算法存在当前点的Hessian矩阵若不可逆则进行不下去的缺点,本章提出了一个具有通用意义的牛顿型NMF算法(NBA算法),它采用在牛顿方向进行不下去时用梯度方向使目标函数值下降的策略,从而很好地解决上述问题.最后,将NBA算法用于三个公共的图像数据集,实验结果表明该算法适用于所有的非负矩阵,且在速度和效果上比同时期的其它算法更优.第3章针对NBA算法中计算Hessian矩阵的逆要消耗的运算量比较大,为了减少运算量且兼顾收敛速度,本章提出两个秩一校正的NMF(1DNMF)算法,即修正的秩一残差迭代算法(MRRI算法)和按元素残差迭代算法(ERI算法).为了避免传统1DNMF中容易丢失一些隐藏在原始图像中的结构信息的问题,我们将二维NMF(2DNMF)算法与MRRI算法和ERI算法分别结合,得到MRRI-2DNMF和ERI-2DNMF 算法.将 MRRI、ERI、MRRI-2DNMF、ERI-2DNMF算法与已有的一些算法分别在三个公共的图像数据集和一个实际应用的图像数据集上进行有效性验证,实验结果表明在同等条件下,MRRI和ERI算法有更小的相对误差、绝对误差、欧氏距离及更好的图像重构质量.在相近的压缩率下,MRRI-2DNMF和ERI-2DNMF算法比各自相应的1DNMF算法有更好的图像重构质量和更少的运行时间.第4章针对重叠社区中的重要节点(重叠节点、中心节点、离群节点)及其固有的重叠社区结构的发现问题,将逼近误差项与非对称惩罚项的和作为目标函数,基于梯度更新的原则及非负约束条件推导出一种新的对称非负矩阵分解(Symmetric nonnegative matrix factorization,SNMF)算法(SNMFP 算法).将 SNMFP 算法用于五个公共网络数据集,实验结果显示SNMFP算法能较好地将实际网络的重要节点及其固有的社区结构发现出来.从社区发现结果的平均导电率和算法的执行时间来评价,基于SNMFP算法的社区发现方法优于非负矩阵分解社区发现方法(CDNMF方法);从准确率和召回率的调和平均值的加权平均值来评价,基于SNMFP算法的社区发现方法比较适合较大数据集的重叠社区发现.第5章从提高SNMF算法稳定性的角度,推导了一个SNMF的乘子交替方向算法(AULAG算法),并对其作了收敛性分析,证明了该算法具有一阶稳定性.本章还对重叠社区发现方法—CDNMF方法作了改进.将AULAG算法与改进的重叠社区发现方法结合后的方法记为AUCDSNMF方法.将AUCDSNMF在五个公共网络数据集上做了实验.大量的实验结果表明AUCDSNMF方法所得结果稳定,能将重叠社区发现的固有结构发现出来,且在多个通用指标上都有较好的表现第6章对论文的整体工作作了归纳总结并对今后的研究方向作了展望.
其他文献
无烟煤固定碳含量高,挥发分产率低,密度大,硬度大,燃点高,燃烧时多不冒烟。通过对核查控制样品的连续测试,用数理统计的方法对核查数据结果进行正态性检验并归一化,分别做出
池塘循环流水养殖具有高效、节能、环境友好等优点,正逐步为养殖企业所接受,并将成为未来水产养殖业现代化发展的重要方向之一。循环流水养殖是在相对封闭的环境中,利用物理
孙煜峰(1901~1967年,图1),上海著名实业家,平生酷爱中国书画,鉴藏历代书画作品数百件,庋藏于其书室“弘一斋”中。自20世纪60年代起,孙煜峰及其家属,怀着满腔爱国情愫,先后三
目的探讨应用定量CT检测骨密度评估抗骨质疏松治疗效果的可行性。方法选择绝经后骨质疏松患者,均给予双膦酸盐类抗骨吸收药物治疗。于治疗前和治疗6个月后检测血清β胶原降解
目的:探讨胰岛素样生长因子Ⅱm RNA结合蛋白3(IMP3)在40岁以上高龄葡萄胎(HM)及侵蚀性葡萄胎(IHM)孕妇中的表达。方法:回顾性选取103例40岁以上HM患者清宫术后石蜡包埋组织标
如果将蒸汽锅炉连排水进行排放,将会使得很多的热能以及干净的水资源出现浪费。蒸汽锅炉连排水经过长时间的排放,将会对周围的环境造成一定的影响。为了降低企业的生产成本,
通过并联橡胶隔震支座,建立串联高架电气设备支架隔震体系及力学模型,应用分布参数梁振动理论,通过边界条件引入集中参数,推导其频率方程,并用数值方法求得频率及振型.应用Be
中小学生的安全意识和应急能力亟需提高,而已有的教育产品缺少互动趣味性,很难吸引学生认真学习。我们探索寓教于乐的多彩教育形式,利用虚拟现实技术,研发了基于三维互动的中
踏着春天的脚步,祖国大地陆续迈入春耕时节。俗话说:“人误地一时,地误人一年”。农业生产如何在疫情防控的关键时期抢好“农时”、抓好“进度”,不仅关系到千家万户的“米袋子”
报纸
近日,继质疑并做空中国高速频道和绿诺国际等5家公司斩获颇丰后,市场研究公司浑水(Muddy Waters)再度质疑多伦多上市的嘉汉林业正操纵“一场庞氏骗局”。$$    中国部分海外
报纸