论文部分内容阅读
微博,作为后Web2.0时代新近兴起的一类信息传播、共享的社交网络服务平台,以其开放性高、交互性强、强大的信息传播能力等优势,已成为一种重要的信息载体和传输媒介。在许多社会热点事件的讨论、网络舆情的爆发、政务反腐、网络营销中都能看到微博的影子,微博对我们的日常工作、生活乃至社会都产生了重要的影响。微博蕴藏的巨大影响力,使其逐步成为国内外学者关注的焦点,也吸引了各个领域的科研人员参与到微博的研究中来。但是,随着微博中的用户群体日益壮大、微博消息急剧膨胀,也伴随着一个不可避免的问题,那就是信息泛滥导致人们的辨识度下降。因此,对微博中用户的影响力进行分析,挖掘出微博网络中可能对信息传播产生关键作用的用户,即具有一定影响力的用户,显得尤为重要。本文将微博用户的影响力定义为:用户通过传播信息或者与他人的交互行为而影响他人的思想或者激发他人产生更多交互行为的能力。从影响力的定义出发,针对原始PageRank算法平均分配权重以及易受到“僵尸粉”干扰的问题,提出一种新的基于交互行为的微博用户影响力评价模型,该评价方法综合考虑了微博网络结构、用户间的交互行为以及用户自身的活跃度,能对用户的影响力进行合理量化。围绕本文的研究主题,本文做了以下工作:首先,基于对微博中用户间的交互行为的分析,并结合微博中的传播特点,建立了微博用户交互模型。通过对交互模型中的四大要素的分析来分析用户影响力的主要因素,从而确定了三个关键影响因素,即微博信息的被接收率、接收用户的活跃度、接收者与传播者之间的交互行为强度,组成用户间的影响强度,并得到用户间的影响力传递系数,作为用户影响力的评价指标。然后,把用户间的影响力传递系数加入到PageRank算法中,作为用户间分配影响力的权值,以此提出本文MUR-IBM(Microblog User Rank based onInteractiveBehaviorModel)算法。基于GraphChi框架,使用C++语言,开发了MUR-IBM算法,此算法可以在个人PC上实现千万级别数据的计算,并且运行时间相对合理。最后,通过腾讯微博平台提供的API抓取了微博网络用户数据。利用实验数据计算了微博网络中所有用户的影响力,给出了高影响力用户的排名,并与原始PageRank算法的评价结果进行对比分析,发现本文的评价模型更能体现用户之间的交互行为,可以削弱微博网络中那些不活跃的“僵尸粉”,验证了本模型的有效性。