论文部分内容阅读
社会网络作为大量而复杂信息的载体,正逐渐成为学者们研究的热门领域,越来越多的社区发现算法涌现出来,但是在实际应用中每一种算法都面临着划分质量不高、效率低、适用范围小的考验,而高效准确的划分算法对于社区形态的挖掘有着积极的意义,对于个性化推荐服务和舆情监测等有深远的影响。本文先是阐述了社会网络以及社区发现领域的研究现状,分析考证了社会网络的相关理论,以及对比总结了传统社区划分算法的优点和缺点,针对传统社区划分算法中存在的社区划分效率低、划分质量不高、适用范围小等问题,提出一种改进型的GN算法,并使之适用于微博网络的社区发现。首先,本文依据主成分分析法构造了基于用户若干属性的综合用户相似度,并利用此度量构建了具有权值的加权网络。然后,本文针对传统GN算法效率低的问题,提出了利用分布式计算思想来计算网络边介数的方法,并在边介数的计算中加入了权值的成分,使得GN算法能够并行处理,节省时间而且适用于加权网络。其次本文又提出了社区贡献度概念,使得社区划分之后遗留的孤立节点能够找到社区归属。最后,本文基于时间序列,认真研究社区结构的变化规律,提取了节点数、边数和社区规模三个网络变化指标,建立了一个基于社区结构变化规律的动态社会网络演化预测模型,并对已有网络进行合理性预测。本文利用Matlab工具进行数据处理,对改进的GN算法和动态网络演化预测模型先后做了实验验证。实验结果表明改进的GN算法不仅能够保障社区发现的准确性,而且计算效率得到了很大的提高,并使得网络中大多数孤立节点找到社区归属,对研究单用户的特征和个性化服务有积极的意义。此后实验又基于时间的顺序,对连续多个时间点的网络进行了社区划分,计算各个指标在整个过程的平均变化值,并将其作为演化模型的输入,对真实网络进行预测,实验结果表明演化模型能够达到较好的预测结果,而且保持了社区的稳定性。