论文部分内容阅读
摘要:在Web2.0技术和信息网络技术的共同推动下,社交网络应用蓬勃发展,用户规模与日俱增。在社交网络中,作为自媒体的用户可以随时随地采用多种接入方式参与交互。这种新型、灵活、快捷的交互模式极大地缩短了舆论产生、发酵、扩散的时间;同时,参与主体的高度能动性、自组织性、异质性,社会舆论对网络舆论的非线性映射作用等特点,均使得社交网络中的舆论信息传播演化的复杂性和随机性陡增。而传统的舆论模型和研究方法难以准确描述用户微观交互行为,更难以解释网络舆论传播和演化的宏观过程。鉴于此,本文使用交叉学科的思想和方法,对社交网络信息传播模式、影响力用户拓扑分析与挖掘、话题发现及趋势预测等问题进行了深入研究,力图发现和还原社交网络中信息传播的微观与宏观规律,建立能够刻画这些规律的数学模型,并寻找可以促进或抑制信息传播的相关策略。论文的工作有助于了解社交网络中舆论演化的过程,加深对网络上的复杂群体行为的认识,也为复杂系统的理论研究提供一些探索性的结果。论文的研究工作得到了国家自然科学基金项目(No.61172072、61271308)、北京市自然科学基金项目(No.4112045)和高等学校博士学科点专项科研基金(No.20100009110002)的支持,主要工作和创新点包括以下几个方面:1.研究基于强弱关系理论的社交网络信息传播模型。该模型以传染病动力学经典模型SIR为基础,将节点间信息传播概率视作边连接权重的函数,之后结合强弱关系理论和复杂网络理论建立了用于刻画网络中节点状态随时间演化特性的平均场微分方程组。在真实网络中仿真发现:优先选择弱关系并不能有效的提高信息传播效率,但是去掉弱关系后,无论网络拓扑结构还是信息传播均大受影响;信息传播过程中最大传播节点密度对于节点免疫概率和兴趣衰减概率的变化非常敏感,且拟合了三者之间的函数关系;异质型节点在同样的信息传播机制下会呈现出类似于同质的变化趋势。该模型及其性质有助于进一步深刻认识社交网络中信息传播行为,为进一步研究网络舆论传播提供基础。2.建立基于社会记忆性和优先选择性的社交网络信息传播模型。该模型认为社会加强因子(社会舆论参与度)、人际加强因子(传播链路权重)以及记忆效应因子(个体接触信息次数)均会影响个体对于信息的决策过程,从而影响信息扩散。通过在两个真实网络中的仿真得知:网络拓扑特征会影响信息传播强度和范围;社会舆论参与度越高,信息在网络中成功扩散的几率就越大;在平均度和聚类系数较大的网络中,免疫节点起到信息防火墙的作用,在一定程度上抑制信息扩散;社会舆论参与度越大,个体平均接触信息次数越少。模型较好地还原了社交网络中信息交互的基本特征,为进一步研究网络舆论传播提供理论基础和形式参考。3.分析社交网络节点中心性特征并提出用户影响力度量方法。在实证分析两个真实社交网络中四类节点中心性指标分布以及指标之间的相关性的基础上,提出一种新的用于区分节点影响力的基于边权重的局域型指标(LW指标)。该指标强调节点的影响力由邻居的数量和质量共同决定,并且其时间复杂度远低于紧密度和介数。之后借助SIR信息传播模型验证LW指标的有效性,在两个真实网络中的仿真表明:LW指标在挖掘影响力较大节点方面的性能优于度、紧密度和介数;相比于k核数,LW指标区分粒度更细,实用性更强。该方法可为社交网络广告营销、用户兴趣推荐、网络舆情分析等应用领域提供理论支撑。4.研究社交网络中话题发现和趋势预测方法。设计一套轻型的网络热点话题发现系统,并提出基于BPNN的网络话题发展趋势预测算法。通过对真实网络话题时间序列的预测发现,本模型相比于ARIMA预测模型在还原话题发展趋势以及预测准确度方面均有更优的表现。在此基础上,采用小波降噪、BPNN网络结构优化和学习率自适应调整策略等对模型进行优化,测试表明改进模型的预测性能有了大幅度提升。最后,建立基于BPNN和ARIMA的自适应社交网络话题发展趋势预测模型,提高了预测模型的适用范围。这些方法对网络舆论的监测及预警具有一定的实际应用价值。