论文部分内容阅读
目前,越来越多的领域及应用都需要关键节点挖掘技术的支持,尤其是人们随着移动终端技术的飞速发展迎来了Web 2.0时代,计算机领域中针对大型复杂社交网络的数据挖掘迎来新的挑战,特别是针对大型社交媒体平台的复杂网络节点影响力挖掘算法成为了研究热点,大量学者都对该问题进行了相关研究与创新。随着研究人员不断弥补传统算法缺陷的同时,现有模型的精确度与适用性有待提高。本论文旨在考虑用户节点拓扑结构特征与行为特征的同时融入信任关系符号网络,提高模型准确性,为社会网络影响力节点挖掘领域贡献一份力量。在现实社交媒体平台中,用户不仅有自身的静态属性,也会与其他用户进行行为与内容的互动,产生情感的交互,而传统算法大多从单一角度去考虑节点的重要程度,与实景情况不符导致影响力节点挖掘结果精确度不够高。据此,本文提出一种利用信任元素构建符号网络进行影响力节点挖掘的方法。首先,针对“僵尸粉”、“水军”的干扰,及行为质量较高的节点影响力往往被忽略等问题,综合用户的拓扑结构特征、行为特征定义了用户自身价值与行为价值的概念,在Hindex算法基础上提出了新的计算方法—H-mining,该方法中采取H因子的二阶迭代方法,以降低干扰,提高挖掘质量;其次,利用社会学中殊化信任的概念构造符号网络,在上述方法基础上,提出HT-mining计算方法,以保证算法时间复杂度不变的前提下进一步提高该方法计算的准确性;最后,选用微博数据集进行实验,验证本文提出方法的有效性和可行性。通过实验结果说明,本文提出的面向社交媒体平台的信任节点挖掘方法在针对大型复杂社交网络影响力节点挖掘方面有较高的精确度和较低的时间复杂度,并且在面对网络中用户活跃时段或用户参与度较高的热点话题时,同样保持了较高的准确度。相比传统的PageRank影响力节点挖掘算法和基于H-index改进的HRank计算方法,本文提出的面向社交媒体平台的信任节点挖掘方法在保证时间复杂度为(9))情况下,计算结果准确性上有很大的提高。