论文部分内容阅读
伴随着大量用户内容的创建和交换,社交网络平台中产生了大规模的互动数据和复杂的用户关系,受到了越来越多研究者的关注。用户发布的图片、文字、视频等信息是一种真实自我的形象化呈现,是一个潜在的、巨大而丰富的资源库。因此,如何挖掘这些隐藏在用户大规模数据和复杂关系背后的社会经济价值,已经成为学者们现下研究的热点。但是现有对关系强度研究多是从用户特征属性相似度和社交行为两方面进行,并未考虑网络结构对关系强度的影响,同时也忽略了社交行为存在的方向性和互惠性问题。此外,先前研究大多聚焦在社交用户的二元关系(例如,有无朋友关系),主要采取定性的研究方法,对于关系强度的研究过于浅显。因此,针对目前尚未解决的问题,本文提出了社交网络用户有向关系强度计算方法(DSTS-ATI),该方法融合用户特征属性相似度、网络结构连接强度、社交行为强度三个维度来综合计算用户关系。文章主要内容如下。(1)社交网络用户特征属性主要有个人背景属性、网络状态属性两大类。个人背景属性是一类静态的个体身份认证属性,例如教育背景、职业等,体现出用户的社会经济地位;网络状态属性是由用户间复杂的关系链接和社交行为产生的历史累积状态信息,例如,用户的短文本信息、用户粉丝数等,能在一定程度上体现出用户的兴趣和偏好、活跃度和影响力情况。为此,本文在计算用户特征属性相似度时综合考虑了个人背景属性和网络状态属性。(2)在计算网络结构连接强度时,本文综合考虑了用户之间的直接关系和间接关系,从节点和路径两个角度对网络结构进行分析。其中,以用户间的共同邻居节点数、邻居节点连接边数来衡量用户间的直接关系强度,以节点间的路径数和路径权重来衡量用户间的间接关系强度。(3)用户间关注关系的不同,使得用户社交行为的发生在方向上存在主动和被动差异,这势必会影响用户之间的关系强度。仅从某一方用户的角度去衡量这种关系强度的做法是比较片面的。为此,本文在计算用户交互强度时提出了一种有向的用户交互强度计算方法,从关系双方分别计算交互强度的感知程度。(4)本文从社交行为的互惠性强弱、互惠性行为是否常见等方面考量社交互惠行为对用户感知互动强度的影响情况。用户间的互动强度是动态变化的,且存在一定的短时平滑现象。基于此,本文在计算互动强度时又引入了时间片和时间衰减因子来动态建模。本文以新浪微博用户作为研究对象,通过爬虫技术获取客观实验数据。为了验证本文模型的科学性和合理性,设计了一系列的对比实验,并以搜索引擎质量指标(NDCG)来评价对比实验和本文模型的实验效果。实验结果证明,融合特征属性、网络结构和社交行为三个维度信息的计算方法能够提高用户关系强度计算的准确性。此外,本文也验证了社交网络用户在同一段关系中所处的地位并不平等,交互双方对于同一段关系感知的强度也是不一致的。因此,该方法能够有效区别出社交网络中用户的影响力,有助于微博意见领袖的发现和信息传播机制的研究。