社会网络中链接预测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:asdf_1900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,社会网络(SNS,Social Network Service)成为了许多人日常生活中的一部分。作为一种新兴的网络服务,社会网络可以为其社会成员提供类似于真实社会环境中的许多功能,社会成员也被这些功能所吸引从而注册加入各种兴趣的社会网络。这些不同兴趣的社会网络,大都会提供种类各异的用户交互服务。例如允许社会成员标记其它成员为朋友或是敌人,或者允许部分成员通过选举成为拥有特定职权的管理员,又或者提供成员对其它成员发表的信息、观点进行评价、讨论的服务。这些种类丰富的成员之间的交互行为数据,是社会成员凭借自身意识在日积月累中生成的,可以反映人类社会发展的一些普遍现象。因此,对社会网络中这些用户交互数据资源进行深入的分析挖掘,无论对于社会网络研究,互联网的发展,以及相关产业,都具有举足轻重的地位。这些种类丰富的社会成员之间的交互行为大部分都可以用链接(Link)的形式来表示。将社会成员表示为图中的节点,他们之间的交互行为就可以表示为节点之间不同类型的链接,这样的图称为链接网络(Link Network)。链接预测(Link Prediction)问题主要以分析链接网络结构为主要方法,从而预测一对节点是否会在未来产生链接,或是预测一对节点之间可能存在链接的类型。如此看来,对链接预测的深入研究,将对分析用户交互行为有着重大的帮助。然而在大部分链接网络结构不可见,或是有新节点加入链接网络时,现有的链接预测方法大都会遇到冷启动问题而导致性能大幅下降。而且社会网络中的链接生成并非为静态离散的,这种动态生成的链接网络中存在着更多的影响因素,然而现有的链接预测方法很少去分析它们。如果能同时利用社会网络中多种形式的数据源,并且更好的对链接行为进行建模,那么就有可能提高链接预测方法的性能,从而进一步能更好的分析社会网络中社会成员的交互行为,并为社会成员提供更好的用户体验。本文主要研究社会网络中链接预测方法,从寻求可用于链接预测的特征和尝试可用于链接预测的方法这两方面展开研究。包括研究基于链接网络结构的预测方法和特征分析,以及研究如何用深度学习方法来预测链接值,并提升链接网络特征的性能。本文研究如何引入用户文本和情感词典来提升预测性能,还尝试将离散静态的链接网络表示为动态连续的序列行为。在引入新特征的同时,尝试使用多模态学习方法来进一步提升预测性能。具体地,本文的主要内容包含以下四个方面:(1)链接网络作为链接预测的基本研究对象,值得深入的研究和分析。我们首先从分析链接网络的结构入手,从链接网络中提取尽可能多的结构特征。因为链接网络结构经常十分庞大,需要较长时间来提取特征。本文优化了特征提取的方法,提高了特征抽取的效率。基于线性支持向量机,本文提出了基于链接网络结构特征的预测方法。通过对模型的分析,并结合相应的社会心理学理论,尝试分析了每种特征对于链接值的影响。(2)本文针对现有链接预测方法存在的问题,给出了具体可行的解决方法。为了解决冷启动问题,结合情感分析方法,本文将用户文本特征和情感词典引入链接预测问题的解决中。基于多源特征,本文提出了优化基于用户相似度度量的预测方法,同时提出优化基于线性分类器的预测方法。为了解决只能对链接进行静态、离散的预测,本文将用户行为转化为动态、连续的序列行为。基于序列行为建模,本文提出了对序列行为中链接值预测方法,以及对序列行为的最终结果进行预测的方法。(3)链接网络结构内可能蕴含着丰富的用户行为信息,本文使用深度学习的方法来挖掘这种隐藏在特征之内的信息。通过对受限玻尔兹曼机能力的分析,本文设计了不同作用的深度置信网络(DBN)结构。基于这些深度置信网络结构,本文提出了基于深度学习模型的无监督预测方法、链接特征表示方法,以及基于DBN的链接值预测方法。为了节省训练时间,优化了DBN训练策略,同时尝试在不同兴趣社会网络数据上交叉训练和测试模型。实验表明深度学习方法能更好的利用链接网络结构特征,从而提升预测性能。(4)在拥有多种数据源的社会网络中,应该充分利用这些不同模态特征的信息来进行链接预测。为了学习不同模态特征的联合表示,本文设计了两种多模态深度置信网络(MDBN)结构,提出了基于多模态学习的链接预测方法。通过对深度置信网络的进一步研究,针对标签分类和样本重构任务,本文提出了两种功能的DBN学习方法。通过使用不同作用的DBN学习方法得到的MDBN,能进一步提升链接预测的性能,同时也可以生成部分缺失特征。
其他文献
在我国城市建设逐渐从数量增长迈向内涵提升的发展阶段,上海特色小城镇在新兴空间形式之外,以更丰富的内涵和发展理念成为寻求大都市郊区经济社会转型的驱动力.首先,定义上海
互联网的快速发展促进了软件的网络化趋势,使得服务逐渐成为软件的核心和形式。Web Service是网络化软件的重要组成部分,服务发现的目标是准确、高效地在互联网环境中搜索Web
医学微生物和免疫学教学在课时少、任务重的情况下,只能根据学校的教学目标、教学对象特点,突出教学重点,抓好基本知识和基本技能训练,适当介绍新理论、新进展,灵活运用多种
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨药物保守治疗及手术治疗异位妊娠对患者预后再次宫内妊娠的临床分析。方法对有生于要求的102例异位妊娠患者,分别对其中55例实施肌肉注射MTX(药物组),57例为腹腔镜输卵
目的探讨强化负压封闭引流(VSD)方案辅助高压氧疗对老年糖尿病足溃疡病人近期疗效及复发率的影响。方法选取2016年1月至2018年6月随州市中心医院收治老年糖尿病足溃疡病人86
【正】 蚯蚓是优质蛋白质饲料,其鲜体含粗蛋白8.5%-9.4%,粗脂肪2.5%,干体含粗蛋白66.3%,粗脂肪7.9%,还含有丰富的维生素,其营养成份接近进口鱼粉而优于豆饼粉。蚯蚓或用蚯蚓粉加工
为了描述沥青路面纵、横向纹理分布特征,基于变异函数理论,建立了路面纹理尺寸分布的半变异函数模型,并按分形几何基本原理,分析路面纹理分形特征与沥青混合料分形结构的关系