网络用户影响力分析和演化趋势预测的研究与实现

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:loverzhouweia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,微博网络迅猛发展,微博成为网民们交流信息的主要平台之一。在微博网络中用户是主体,学者通过对微博中用户的属性和行为进行研究发现,少量的核心用户对网络的信息传播起到决定性的作用。核心用户在微博中具有较大的影响力。因此,微博用户影响力分析和演化趋势预测是网络舆情监控、智能信息处理和信息安全等领域的重要研究课题,具有理论和实际价值。本文主要研究网络用户影响力排序分析和用户影响力演化趋势预测。用户影响力排序是指对网络中用户对其他用户可能造成的影响力值进行计算并排序。针对网络用户影响力排序,本文提出和实现了一种基于IntegrationRanker的用户影响力排序分析方法、一种基于排序学习的用户影响力排序分析方法。基于IntegrationRanker的用户影响力排序分析方法对经典PageRank算法进行了改进。改进之一是在PageRank算法的初始赋值时引入了用户活跃度、粉丝认可度等用户影响力特征,改进之二是在PageRank算法迭代过程中对PageRank值的分配方式进行了改变。基于排序学习的用户影响力排序方法主要将用户影响力计算转化为排序问题,使用排序学习模型进行模型训练。用户影响力演化趋势预测问题是指将用户已有特征作为用户未来影响力排序的依据,对用户的影响力演化趋势进行预测。针对用户影响力演化趋势预测问题,本文提出和实现了一种基于时间跨度的用户影响力预测方法、一种基于话题领域的用户影响力预测方法。这两种方法的核心思想是将用户影响力预测问题转化为分类问题,采用分类模型预测用户在未来时间段或未知话题领域内的影响力排名。该方法将用户影响力的预测问题转化为TOP-K预测问题。本文在时间段数据集和主题数据集上进行实验。实验数据表明,基于IntegrationRanker的用户影响力排序方法比经典的用户影响力排序方法效果更好。同时基于排序学习的用户影响力分析方法,在使用随机森林模型时的排序效果比使用MART,RankNet和RankBoost时的排序效果更好。基于时间跨度和基于话题领域的用户影响力预测方法在使用LibSVM模型时也得到了比使用J48决策树、朴素贝叶斯和随机森林模型时更好的预测效果。实验结果表明了本文方法的有效性。
其他文献
<正>有首诗中写到:"横看成岭侧成峰,远近高低各不同"看物是这样,看人又何尝不是这样?尤其是我们小学教师,如果能用欣赏的目光来看待我们的学生,充满关爱,根据学生的个性差异,
目的:探讨静息态下不同性别抑郁症患者的脑功能特点及其差异。方法:男女抑郁患者各11例及性别、年龄、受教育程度均与患者匹配的健康对照22例参加静息态fMRI扫描。结果:男抑郁组
公交系统是一个相对开放的系统,影响公交运营的因素众多且复杂,其中公交系统的内部影响因素包括公交客流波动,车队车辆配置情况,调度方案的执行情况等,外部影响因素包括工作
"细节,体现品质。"辅料,作为成衣生产中必不可少的细节,不仅是成衣品质的体现,更是服饰产品设计中的点睛之笔,是服装设计理念的"语素"和"语境"延伸。在国内辅料企业以多样化
随着全球化进程的日益加深,世界各国之间的文化交流日益频繁,尤其是在经济飞速发展的今天,文化和语言因素开始逐渐被人们所看重。所谓软实力竞争,在很大程度上就是各种文化和
<正>1"老西门"项目的时代性|崔愷|对于"老西门综合片区改造"这个项目,我觉得跟时代发展到了今天这个阶段密切相关。目前,中国经济进入了一个慢行期,整个社会都进入了调整期,
射击运动是静力运动项目,尤其是步枪项目,技术动作要求身体姿势规范并保持相对固定较长时间。在气步枪和卧射中,运动员常常需要保持一个姿势动作60 min以上,期间偶尔会有小幅
本文以云南省为例,针对机动车联网综合检测平台建设现状、需求及实现方法进行了研究。论文运用工程理论,通过广泛调研、系统分析等方法,结合云南省机动车联网综合检测现状,通
长链非编码RNA(long non-coding RNA,lncRNA)是指转录本长度超过200个核苷酸的不编码蛋白的RNA。lncRNA参与了各种各样的生物学过程且发挥重要调控功能,如:细胞增殖、凋亡、
【目的】建立和优化金铁锁SSR-PCR反应体系。【方法】以金铁锁嫩叶为试验材料,采用Ezup柱式植物基因组DNA抽提试剂盒、SDS法和CTAB法提取金铁锁DNA,并对提取结果进行比较。利