论文部分内容阅读
网络科学是研究复杂网络系统的定性和定量规律的一门交叉科学,研究涉及到复杂网络的各种拓扑结构及其性质,其研究对象来源于各应用领域,例如移动通信网络,交通网络,电力网络等.应用领域中很多网络都具有社区结构,即整个网络由多个社区构成,社区内个体之间的连接比较紧密,社区间个体之间的连接比较稀疏.由于社区结构对于深入理解网络的本质和充分利用网络的信息具有重要意义,社区发现成为了网络数据分析的一个重要课题.传统的网络社区发现算法着重于研究社区的定量刻画和社区结构的有效挖掘,多数社区发现算法把网络中的个体分且仅分到一个社区,但在许多实际的网络中,社区结构往往具有相互重叠的特征,即存在一些“骑墙节点”,这些骑墙节点可能同时属于多个社区.在这种情况下,挖掘重叠社区结构和分析重叠节点的特性,将有助于我们更准确地了解网络的结构特征.2010年,Lehmann等人提出了一种能够发现具有重叠性和层次性社区结构的方法,把社区看作是网络中边的集合,对边进行社区发现,进而基于边的社区得到原网络节点的重叠社区.然而,在很多真实网络中边数往往大于节点数,因此把边图作为二级图进行聚类与直接将节点进行聚类相比,将极大地增加社区发现算法的计算量.鉴于此,从实现重叠社区结构发现且同时减少计算时间的角度出发,本文提出了一种基于团图的重叠社区发现新思路.其中,由于在很多网络中团的数目往往远小于边数,我们将把网络中的社区看作网络中团的集合,对团进行聚类,再将团的社区转化为原网络节点的社区.由于节点可以属于不同的团,所以节点就可以属于不同的社区,于是我们将可以得到可重叠的社区结构.基于团结构的全耦合性,团图聚类算法能够在社区内保留团内节点紧密连接的特点,这使得基于团实现的重叠社区发现也保持了准确性.同时提出了重叠节点成对的社区隶属度和成对的社区介数中心性定义,可以通过这些性质来判断重叠节点在所属社区间的传递性.