论文部分内容阅读
在大数据的大背景下,信息技术飞速发展,出现了越来越丰富的可供研究的数据,现实世界中的很多复杂系统都可以抽象成网络的形式。挖掘网络中有价值的、具有稳定性的社区,对网络信息的获取、推荐及网络的演化预测具有重要的价值。目前,大部分社区发现方法都是针对同质网络进行的,但是节点和关系类型多样的异质网络在某些领域能够更加准确地描述现实世界。异质网络中的异构性导致以下两个问题:(1)异质网络中互动噪声很多,引起算法的性能降低;(2)各个异质节点关系错综复杂,难以在同一维度中有效整合网络中的异质信息,挖掘出符合实际的社区结构。针对以上问题,本文以异质网络中的大量存在的星型网络为研究对象,提出了基于图正则项非负矩阵分解的异质网络社区发现算法,本文完成的关键技术工作如下:第一,根据概率潜在语义分析赋予非负矩阵分解的概率解释意义,设计了一种可以融合各个子网络异质信息的联合优化算法。算法中引入反映不同子网络共有潜在结构的共识矩阵,它的每个行向量作为中心类型节点在每个社区当中的隶属度分布,通过轮流固定系数矩阵和共识矩阵,反复迭代对两个反映不同类型节点的子空间进行优化,从而成功解决了有效整合异质信息的问题,同时在降维过程中较大限度地保留了异质信息的完整性。第二,算法在考虑了不同子网络之间异质关系的基础上,结合多重子空间的流形约束,利用图正则化,将中心类型子空间和属性类型子空间的连接关系,即各个子网络内蕴的拓扑结构信息作为约束项,引入到正则化联合优化算法之中。通过优化法则不断迭代系数矩阵,找到了高维数据在低维空间的紧致嵌入,成功消除了异质节点之间的部分噪声。第三,在真实数据集上,对本文所提出的优化算法进行了测试和分析,借助Matlab软件平台完成了算法实现,以及结果可视化。通过和目前常用的算法进行对比,证明了算法的有效性。