在线社会网络中影响力度量和流行度预测问题研究

被引量 : 0次 | 上传用户:jy8578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展和Web 2.0时代的到来,互联网上涌现出各种类型的社会媒体,深刻的改变了人们获取信息和相互沟通的方式。社会媒体作为新的传播媒介,大大弱化了传统媒体在信息传播中的主导地位,使信息传播过程呈现出用户既是信息源又是信息受众的网络化传播模式。社会媒体的出现和发展大大降低了在线社会网络中信息传播的成本,使其呈现出传播速度快、覆盖范围广和社会影响力深等特点。然而已有研究指出,在线社会网络中信息的流行程度呈现幂律分布,即仅有少量的信息可以覆盖大范围的用户,而大部分信息均不能变得流行。这种现象使研究者对以下几个问题比较关注:什么样的信息能够变得流行,即能否在信息传播初期预测其流行程度;信息传播过程涉及的诸多因素中,决定信息流行程度的关键因素是什么;如何衡量网络中用户传播信息的能力并进一步识别出在信息传播过程中起到重要作用的用户等。以上问题涉及对在线社会网络中影响力度量和流行度预测等问题的研究,这是目前国内外研究的热点问题,也是本文关注的主要研究问题。本文以国家自然科学基金为依托,围绕在线社会网络上信息传播过程这一研究主题,主要针对影响力度量和流行度预测两个关键问题展开研究。本文的主要工作和创新点包括以下几个方面:1.提出了一种基于网络局部结构的节点影响力测度。为实现对大规模在线社会网络中节点影响力准确而高效的度量,本文提出了一种基于网络局部结构的局部结构化中心性(Local Structural Centrality,简称LSC)测度。区别于已有局部测度,LSC测度综合考虑了节点周围局部网络的拓扑结构信息以及最近邻节点的影响力反馈。具体的,节点周围的局部网络由节点与其最近邻和次近邻节点组成,局部网络的拓扑结构信息包括网络中节点的数量和节点间的拓扑连接。最近邻节点的影响力反馈体现在节点的影响力为其最近邻节点相对影响力的线性和。为验证LSC测度的有效性和鲁棒性,本文在不同规模的真实网络以及不同规模、不同度分布、不同社区结构的人工网络上进行实验。实验结果表明,LSC测度对节点影响力度量的性能优于度中心性、k-壳中心性、介数中心性、接近中心性和局部中心性等测度,而且其性能不受网络类型的影响。此外,实验结果表明LSC测度可以更为细致的区分节点的影响力并能够对网络中最有影响力的节点进行更好地排序。由于仅考虑了节点周围的局部网络,LSC测度具有较低的时间复杂度,可在大规模网络上直接应用。2.研究了微博平台上流行度预测问题中的有效特征。本文通过将微博平台上的流行度预测问题形式化为分类问题,研究了分类问题中的有效特征。具体的,本文研究了两种预测任务,基于消息在其发布后1小时内的转发过程预测消息流行度(PPIH)和基于消息的前k次转发预测消息流行度(PPkR)。本文将两种预测任务分别形式化为预测消息流行度取值区间的多分类任务和预测消息是否会流行的二分类任务,并采用了五种常用的分类器(朴素贝叶斯、K近邻、支持向量机、逻辑回归和Bagging决策树)。为识别分类任务中的有效特征,本文对消息转发过程中的一系列特征进行了研究分析,其中包括从底层用户网络中提取的转发网络特征和边界网络特征,以及从消息转发链中提取的时间特征。进一步,为消除用户活跃度变化对分类任务的影响,本文提出了微博时间的概念,并用其度量时间特征。通过在新浪微博数据集上的实验结果表明:在预测任务PPIH中,结合了全部特征的Bagging决策树具有最优的分类性能,而且边界网络特征比剩余两组特征更有效;在预测任务PPkR中,仅通过前10条转发消息的时间特征就可以取得较好的分类性能。进一步,实验证实,通过引入微博时间的概念,时间特征的分类性能可以得到显著提升。3.提出了一种基于增强泊松过程的微博消息流行度预测模型。该模型从建模微博消息转发过程对应时间序列的角度研究了流行度预测问题。具体的,该模型基于增强泊松过程,建模了消息流行度的增长机制,其中包括消息转发过程中的三个关键因素:(1)消息的适应力,表示消息吸引用户转发的能力;(2)幂律时间松弛方程,描述消息新颖性随时间衰减的现象;(3)指数增强方程,描述消息转发中存在的优先连接现象。进一步,为了消除用户活跃度变化对于模型预测性能的影响,本文再次引入微博时间的概念并设计时间映射过程。通过在新浪微博数据集上的实验结果表明:相比于已有的预测模型,本文提出的模型可以更有效的建模微博消息的转发过程并对消息流行度进行更准确的预测。此外,通过在模型中集成时间映射过程,可以去除用户活跃度变化的影响并显著地提高模型的预测性能。
其他文献
陶孟和是我国近现代史上著名的社会学家,是中国社会学的奠基者,同时也是一位著名的资产阶级职业教育思想家。1919年,陶孟和在《新教育》第2卷第2期发表《留学问题》一文,对近
传统装配培训手段很大程度上受到时间,地点,受训人员层次等因素的影响,为了提高培训的效率和减少培训成本,使用EON软件建立了虚拟装配培训系统。系统使用3ds max软件建模,交
西昌市,位于川西高原的安宁河平原(四川第二大平原)腹地,是凉山彝族自治州的州府所在地,风俗独特,彝风浓郁。倘若驾车的话,离开海滨,依山而上,车行8公里左右到达田园区进入四
期刊
盐渍土在我国的分布十分广泛,其具溶蚀、盐胀和腐蚀等工程特性,并由此导致多种地基病害。因此,对盐渍土的研究十分必要,以此避免或减轻盐渍土对工程地基造成的损害。本文阐述
编译,顾名思义是一种包括编辑过程和翻译过程的翻译活动。随着时代的发展,编译被广泛地应用于翻译实践中。新闻报道的编译作为一种编译活动越来越受到学者们的重视。在过去,
实践教学水平已成为衡量职业院校办学质量的重要标准之一,职业教育注重的是学生操作能力和职业技能的培养,构建完善的校内实践教学体系是学生日后与职业岗位实现无缝对接的基
本文阐述了跨文化交际的问题。在地球村里,人们互相分享、认知他们的观点、信息和价值观。与此同时,当今的世界也带给人们众多的文化方面的挑战。针对由跨文化差异而引起的误
焦点是语用层面的概念,属于表层结构。焦点分为信息焦点和对比焦点。信息焦点是信息结构在句法结构上的体现,在各种语言中语法化程度都很高,对不同语序的意义有较好的解释。而对
目的探讨万古霉素磷酸钙骨水泥治疗慢性骨髓炎的临床效果。方法选取2014年6月-2017年6月入院治疗的70例慢性骨髓炎患者,随机分为两组,万古霉素磷酸钙组患者给予万古霉素磷酸
黑白版画是一种以黑、白、灰为基调构成的一种艺术形态。大面积的黑与白需要尤为重要的灰色去链接、和谐、统一。运用凹凸的肌理变化使灰色调在黑白木刻版画中起到神秘而又不