论文部分内容阅读
信息时代,随着互联网的广泛应用,社区网络种类和规模都在迅速发展。发现其社团特征,有利于人们研究社会活动规律,建立更好的交流平台或阻止不良信息的传播。但是,如何快速有效地发现大规模社区网络中的社团还是一个很大难题。本文以利用局部信息快速有效发现大规模网络中的社团为目的,分析改进已有算法实现了适合本文研究的算法,并对社团的特征做出分析。本文工作可以分为三部分。第一,分析已有的一些算法,确定了最适合本文研究的LFM算法。LFM算法是采用团测度的局部算法,只需要局部信息就可以发现社团,并且还能发现重叠点。第二,发现了LFM算法中存在的两个问题,从多个角度尝试改进,验证分析并确定了最佳的改进方案。第一个问题是原始算法遇到干扰点时会出现达不到停止条件的现象,第二个问题是遇到大规模社团时效率极低。本文从断开干扰点连边、提供优化种子、禁用干扰点选择优化种子生长方向三个角度针对第一个问题做了改进。提供优化被选集,且让社团中每个节点都作为种子参与社团发现过程的办法提高了算法的效率。第三,本文分析了社区网络的特征,包括社团规模,社团规模与重叠点关系,社团密度。通过仿真发现社团规模分布呈现重尾分布特征。重叠点在小社团中出现的概率大,大社团中很少或几乎没有重叠点,且在一定范围内社团内重叠点数量与社团规模呈现正相关。社团内部连接密度与规模成正相关,外部连接密度在不同拓扑网络中表现不同,团测度基本不随社团规模变化而变。本文在最后做出了总结并对下一步工作提出了展望。