论文部分内容阅读
社交网络在人们日常生活中扮演着重要角色,越来越多的用户在社交网络上分享内容、传播信息和表达观点,使得信息在社交网络上的传播异常活跃。用户之间的相互关联构成了社交网络的拓扑结构,也是社交网络中信息传播的重要渠道。社交网络内容作为信息的主体,对信息传播有重要作用。结合这两部分才能深入地分析社交网络用户影响力。用户的兴趣向量可以由多个主题构成的主题分布来表达,在多主题条件下,用户影响力传播也会有所不同。在多主题社交网用户影响力分析中,两个重要问题:一是对全局信息流构造有效的多主题影响力传播模型,二是对多主题影响力最大化问题进行建模和优化。本文针对以上两个问题,对多主题条件下的影响力传播模型和影响力最大化问题进行了研究,并取得了以下研究成果:1.针对传统影响力传播模型缺乏社交网络内容支撑以及存在拓扑结构局限性的问题,提出了一种全局信息流的多主题影响力传播模型,设计了多主题影响力传播算法。模型结合了社交网络拓扑结构和社交网络内容的主题特性,使模型更加贴近真实社交网络。同时引入了主题簇的概念,突破了拓扑结构的限制,使影响力能够在全局范围内传播。在模型的基础上设计了多主题影响力传播算法,并最终获取各个主题的用户影响力的排序列表。通过在真实社交网络数据集上的实验,验证了模型的有效性以及算法的鲁棒性,然后分别在独立级联模型和主题感知独立级联模型下对高影响力用户的影响力进行了验证。实验表明影响力传播模型具有较强的主题相关性,能够很好地模拟多主题条件下的影响力传播,算法具有较好的鲁棒性。2.针对影响力最大化缺乏主题相关性以及算法性能较差的问题,提出了一种基于最大激活路径的多主题影响力最大化计算模型,根据贪心算法的思想设计了多主题影响力最大化算法。模型结合了用户之间的转发概率和相似性来定义激活概率,并使用参数调节影响范围大小和目标用户精准度。在主题感知独立级联模型的基础上,引入了最大激活路径对社交网络中的影响范围进行量化。通过数据预处理、路径过滤、缩小搜索范围等方法对算法进行优化。通过在真实数据集上的实验,对算法性能进行了对照评估,并且对参数的影响进行了讨论。实验结果表明表现出算法具有良好的性能和可调控性。