论文部分内容阅读
社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系[1]。经过研究发现社会网络具有高度的社区特性,社区内部成员间联系相对紧密,不同社区间的成员联系相对稀疏[2]。社区发现技术就是要对社会网络中的社区进行挖掘。近些年,随着信息技术的发展尤其是万维网的发展社会网络呈现出了新的特点,比如:规模庞大、社区成员间具有多重联系、网络更新演变等等。现在主要的社区发现技术多半已经不能适应这些新的特性。 针对当前算法的不足,本课题将大规模社会网络中的快速局部社区发现技术作为研究的重点方向。局部社区发现是指:从一个点或者一些点出发,找到它们所在的局部社区。本课题的主要工作包括: (1)本课题通过研究发现社区具有局部性特点。社区具有局部特性,一个人由于其交际范围所限,其社区会呈现局部性特点。小的社区会凝结成大的社区,而社区间具有相对的独立性。因此在社区发现的过程中可以利用局部性的特点减少算法的时空开销。 (2)本课题提出了一种新的局部社区发现框架。根据社区局部性的特点,可以发现:如果能够找到目标局部社区所在的子图,就可以在该子图内进行社区发现,进而找到目标局部社区。该框架算法首先利用随机漫游(random walk)找到一个包含目标社区的局部子图,然后在该子图上进行社区发现,进而找到目标局部社区。通过大量的实验证明,该框架算法具有很好的社区发现效果,并且具有较小的时空开销。 (3)本课题提出了一种利用局部社区发现结果组合出全局社区划分的算法框架。局部社区发现算法有较小的时空开销,因此自然的想到可以利用局部社区组合出全局社区划分从而实现大规模网络的社区划分。该框架的主要思想是:首先,通过迭代的进行局部社区发现对全局网络进行粗划分,然后利用贪心算法对于一系列的局部社区进行细划分,从而得到全局的网络划分。 基于以上研究成果,本课题设计实现了一个图挖掘系统,该系统可分为数据预处理模块,可视化模块,社区发现模块等,可以对社会网络进行挖掘,分析,和展示。