论文部分内容阅读
在线社交网络在近十年来得到了迅猛发展,社交平台诸如推特、脸书和新浪微博等逐渐成为当下热门的网络应用。于是,有许多学者将目光放在了信息传播的研究上。而在这些研究中,由于能给推广商带来经济上的收益,影响力最大化(IM)问题无疑是一项重要的信息传播研究课题。IM问题的目的在于从社交网络中选择k个种子节点作为初始活跃用户,使得信息传播过程结束之后当前网络中活跃用户数量最多。IM问题主要应用于产品推广、阻止谣言扩散以及潜在社交好友推荐等场景中,广阔的应用环境足以说明IM问题在信息传播研究中的重要地位。现有的IM传播模型主要专注于已经建立社交关系的用户之间的信息传播,然而我们注意到在现实生活中,人们往往出于自身兴趣或是群体压力跟随群组内陌生人的选择。这种行为在社会心理学中被定义为跟风行为。因此本文一大贡献为从考虑跟风行为对于信息传播的影响出发,对信息传播模型进行新角度的建模。我们认为跟风行为是从用户角度影响了信息传播,并用用户画像对跟风行为进行了定义,通过从用户画像中提取群组特征形成群组画像,我们进一步定义了多种跟风行为即朋友跟风、群组跟风以及信息吸引,由此得到群组拓扑下用户之间的激活概率,建立了考虑跟风行为的信息传播模型。基于跟风行为下的信息传播模型,本文另一贡献为提出了在群组拓扑上的IM算法即GIM算法。在仿真实验部分,我们选择两种经典IM算法与我们自己提出的GIM算法进行对比,在三个数据集上分别运行算法。从影响力覆盖范围、特征匹配率和算法运行时间上我们可以看到,GIM算法在信息传播上保证了与贪心算法接近的影响力覆盖,并大大缩短了运行时间,验证了GIM算法的高时效性,同时我们认为活跃用户对信息的喜好程度可以由特征匹配率来体现,高特征匹配率代表了用户对于信息的高兴趣程度,表示信息不仅达到了扩散的目的而且能够在人群中获得认同,即为信息传播有效性得到了保障。