采用社团信息的链接预测方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:caciquer1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的发展,拥有海量数据的复杂网络不断出现,如何从这些网络中挖掘出有价值的信息是一个十分艰巨的任务。链接预测是数据挖掘领域的重要分支,也是社会网络分析的关键任务之一。链接预测研究如何利用网络中已有的信息预测可能存在或即将生成的链接,对于理解网络的结构和发现网络中隐藏的信息有着重要的理论与现实意义。近年来,链接预测已然成为数据挖掘领域的研究热点问题,被广泛应用于社会网络、生物网络和信息网络等多种现实网络当中。目前,国内外关于链接预测的研究主要是基于节点相似度的方法,因为该类方法具有较低的时间复杂度和良好的预测效果。随后,监督学习技术被应用于链接预测任务中,用于学习网络结构和链接形成之间的规律。然而,已有的方法存在一定的局限性,即仅仅考虑节点与邻居节点之间的局部关系,而忽略了节点与其他非邻居节点之间的全局关系。事实上,现实网络中普遍存在社团(Community)的结构,同一社团中的节点之间连接紧密而不同社团中的节点之间连接松散。社团对链接的形成有重要的影响,同一社团中的节点对一般更容易形成链接。因此,如何利用网络中的社团信息改进现有的链接预测算法是一个值得深入研究的问题。针对链接预测研究的问题与挑战,本文将社团信息用于链接预测,在基于监督学习的链接预测框架下,提出了一种采用社团信息改造样本特征的链接预测方法(CR-LiP)和一种采用社团信息扩充样本特征的链接预测方法(CE-LiP)。最后在ACF数据集与FaceBook数据集中进行了仿真实验,将CR-LiP、CE-LiP与相关方法进行了比较。实验结果表明,抽取网络中的社团信息扩充节点对的描述子,可以改进学习器的性能,提高链接预测方法的准确率。
其他文献
随着信息技术的发展,图像处理技术已经成为科学研究的有力工具。在医学图像处理领域,应用分析处理系统对减轻医生的阅片劳动强度和提高诊断精度具有重要的意义,而图像分割是图像
随着信息时代的到来,人们对数据交互和通信的需求越来越大。大多数的数据和信息可以通过传统的路由-交换互联网有效传输,但在一些网络设备难以架设的偏远山区以及在河流湖泊
数据挖掘技术通过对数据库中的数据进行挖掘,可以得到很多重要的知识,包括分类知识、聚类模式、关联规则以及序列模式等等。其中关联规则是通过分析数据库中频繁出现的数据之
聚类和分类是数据挖掘中的基本任务。长期以来,关于聚类技术在分类中的研究主要集中在应用聚类对训练数据进行数据预处理,期望通过减少噪音数据的影响提高最终的分类精度,因此,如
在游戏项目开发中,游戏工具的开发始终占据重要的位置。软件工程技术的进步使得越来越多的工程开发理念被应用到游戏领域。无论是游戏设计理念、项目开发流程,都使得开发效率
信息技术的迅速发展使数据库面临的安全问题更加复杂和多样,数据库作为信息系统重要数据的存储和处理核心,往往成为最吸引攻击者的目标。访问控制技术是数据库安全领域的一个
学位
失衡数据集是数据挖掘领域中广泛存在数据状态,由于不同类别的数据样本数量差异悬殊而使得正常的分类算法效果不明显。在数据挖掘领域中还有一个不可避免的问题就是数据缺失,
随着嵌入式系统以及多媒体技术的高速发展,使用嵌入式技术来实现视频点播、视频会议、视频监控等功能己经成为现在的研究热点。这样的嵌入式系统一般都具有功耗低、成本低、
随着互联网的高速发展,网络信息爆炸式增长,于此相比,互联网中的知识却相当匮乏。在此背景下,基于Web2.0的各种交互式百科知识网站应运而生并发展壮大,为用户提供了大量的有
在一个大规模分布式系统中,为了能够减少失效节点所造成的计算损失,基于卷回恢复的容错技术得到了广泛使用,其中具有代表性的如检查点技术。在设计检查点协议过程中一个关键问题