论文部分内容阅读
复杂网络(Complex Network)是目前描述复杂系统的一种有效的方法,例如生物系统、社会系统、交通运输系统、电力系统等等都能够用复杂网络来描述。链路预测(Link Prediction)与社团挖掘(Community Detection)是目前对复杂网络的规律及特征进行挖掘分析的主要方法,链路预测是指根据已有的网络链接预测潜在或未来的链接的过程,可用于揭示网络系统中对象之间的点对点相似性;社团挖掘是在复杂网络中依据网络的拓扑结构或者节点的属性信息将节点划分到不同社团之中,社团挖掘实质上是对复杂系统中对象的聚类过程。本文将基于局部结构信息对复杂网络中的时序链路预测和局部社团挖掘算法及其分布式化进行研究,主要包括以下几个方面的内容:(1)针对目前链路预测算法准确度较低的问题,本文提出一种基于时间序列信息的链路预测算法,首先将网络中节点之间的不同时刻的连接频率压缩成节点之间的连边权重,然后基于压缩后的图利用改进的标签传播算法进行链路预测,在标签传播的过程中利用时序信息拟合的链路权重对标签中的相似信息进行修正,最后聚合各个节点收到的相似信息作为最终链路评分,根据评分阈值即可确定预测连边,实现对未来网络中节点之间连接情况的预测。(2)针对目前社团挖掘算法的低效率问题,本文提出一种基于局部信息的局部社团挖掘算法。为了解决局部社团挖掘算法对初始选点位置敏感的问题,本文首先综合节点度数和节点邻居之间的连边计算每个节点的关系密度,基于高斯模糊算法综合节点自身的关系密度和邻居的关系密度计算出每个节点的社团中心性;随后从给定的初始种子节点出发,利用节点的社团中心性进行有指导的随机游走,寻找靠近种子节点附近的局部社团中心;最后从找到的局部社团中心节点出发向外扩张,在满足局部社团内聚系数增长的前提下不断将局部社团周围的节点纳入社团,迭代计算结束后即可得到种子节点所属的局部社团,从而获得精度更高的局部社团节点识别。(3)目前复杂网络的规模快速增长,针对大型复杂网络的分析需求,本文分别对时序链路预测和局部社团挖掘算法实现了分布式并行化并基于Spark GraphX图分布式计算框架对算法进行了实现。