基于SAF模型的社会网络数据挖掘

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:csutouyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的飞速发展,社会网络变得越来越复杂,人们开始将数据挖掘技术应用于社会网络。旨在从社会网络中寻找更深层次、更有价值的知识。寻找一种能充分利用社会网络中的各种信息的模型,对于提高社会网络数据挖掘的有效性有着重要的意义。本文的研究对象是邮件网络,它是社会网络的一种,邮件网络包含着丰富的信息:通信关系、通信方式、通信频率等等。AF模型是郭军教授提出的一种激活力测度模型,该模型在词网和蛋白质网络的研究中已经取得了优异成绩。本文将AF模型与邮件网络的特性相结合,对其一些变量进行重新定义和设定,进而衍生出了邮件网络中的SAF模型。首先,研究了社区发现问题。将SAF模型中最核心的两个测度(激活力和相似度)应用于社区发现,详细讨论了如何构建SAF模型。在掌握社区发现的重点与难点之后,总共实现了三个算法:经典GN算法,基于激活力的GN算法,基于相似度的社区发现算法。结果证明,通过激活力先删去部分边缘节点后,再运行GN算法会有比较好的效果;而相似度则先将节点构造为树,然后通过剪枝的方式来生成子社区。其次,研究了链接预测问题。利用相似度来寻找最相似的节点,然后利用激活力来寻找最亲近的节点。这两种方式相结合,就构成了本文的算法。通过准确率和召回率两个指标,证明该算法是有效的。最后,研究了社区核心人物的挖掘问题。建立“关注度”分享模型,然后从通信频率和激活力两个角度进行了研究,对结果进行了分析,证明通过激活力来挖掘核心人物是有效的。本文的研究基础是SAF模型,实验也证明了SAF模型的正确性和可行性。SAF对社会网络的数据挖掘有积极的帮助,是一种全新的研究思路和方式。但是SAF模型还需要进一步的完善,这也为今后的研究工作指明了方向。
其他文献
属于村民小组的水库,村委会能不能代替村民小组发包?不久前,安徽省肥东县杨店乡读者张先生反映,他们当地有一处水库,横跨两个行政村,属当地5个村民小组集体所有.多年来,水库
期刊
前言恒温动物和人在发热时体温很少超过一定限度,例如,人体体温很少超过41℃,称为热限现象,提示体内存在着调控体温的自限机构,但其机制尚不十分清楚。脂多糖(lipopolysaccharide,LP
研究人类基因组的个体差异进而了解个体疾病易感性及对药物敏感度,对个体基因组的再测序势在必行。目前实用的基因组测序方法费时费力,于是发展快速低成本的基因组测序方法正成
如今小水泵成为农耕必备,然而一部分人不按照安全用电的有关规定,随意私接电线,任意增加用电设备,零火线往半空中裸露的公共电线上一搭,虽省时省力,但其实是极不安全的.私拉
期刊
IPv6 (Internet Protocol Version 6)是互联网工程任务组设计的用于替代现行IP协议(IPv4 Internet Protocol Version 4)的下一代IP协议。IPv6将IP地址长度扩展到了128位,能够
融合通信(Unified Communication)将计算机网络与传统通信网络融合在一起,能够同时实现语音、数据通信以及众多相关应用服务。通信的融合意味着可以让各类不同通信手段统一在
摘要:机械教学具有极高的专业性,而且学习起来十分枯燥。再加上其知识点比较零碎、复杂,很多学生在学习过程中经常叫苦不迭。微课的引入,在很大程度上能够解决这一现状。本文主要就微课在职高机械教学中的应用进行浅析,希望能给广大教师提供参考。  关键词:微课;职业高中;机械教学  《中国制造2025》的提出使得我国制造业的竞争越来越激烈。在这一社会大环境下,专业人才极其紧缺,这对于各职业高级中学来说是机遇也