动态异质信息网络表示学习研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xuefeng96ew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络表示学习的快速发展为网络数据分析提供了新颖的研究思路,有效提升了数据挖掘任务的表现。传统网络表示学习方法大多聚焦于静态、同质的信息网络,即假设网络是静止不变、节点和边类型单一。然而,真实世界的网络往往是动态变化、节点和边类型多样的,即所谓的动态、异质信息网络,这使得传统方法无法有效建模网络的真实特性,学到的节点向量表示很难适用于真实场景。因此,本文立足于研究动态、异质的信息网络表示学习算法。具体而言,本文首先研究了网络的动态性问题,并提出结合微观和宏观动态性的动态网络表示学习算法M2DNE。其次,本文研究了网络的异质性问题,并提出关系结构感知的异质信息网络表示学习算法RHINE。然后,本文研究了网络的动态性和异质性问题,并提出了动态异质信息网络表示学习算法DyHNE。最后,本文在微信“看一看”的文章推荐场景下,研究了好友增强的推荐问题,并提出社交影响力专注的神经网络SIAN,以验证异质信息网络表示学习在真实场景下的有效性。真实世界中,动态网络是非常常见的,其通常随着时间在微观和宏观层面不断演化。微观动态性细致地描述了网络结构的形成过程,而宏观动态性表示网络规模的演变模式,两种动态性都是刻画网络演变的重要因素。但是,如何准确地在网络表示学习中捕获两者,尤其是宏观动态性,还没有被很好的研究。因此,为了研究网络的动态性问题,本论文提出了结合微观和宏观动态性的动态网络表示学习算法(Temporal Network Embedding with Micro-and Macro-Dynamics,简称M2DNE)。对于微观动态性,M2DNE构建时序注意力点过程来捕获网络结构的形成过程。对于宏观动态性,M2DNE定义由网络嵌入表示参数化的的动力学方程。时序动态网络中,微观动态性和宏观动态性的交互的演变交替地影响节点表示的学习过程。在三个真实的动态网络上,丰富的实验验证M2DNE显著地优于最新方法。另一方面,信息网络往往是异质的,即网络中包含多类型的节点和边,称作异质信息网络。现有的大多数异质信息网络表示学习方法通常使用单一模型不加以区分地建模所有关系,这必然会削弱网络嵌入表示的能力。因此,为了研究网络的异质性问题,本论文考虑了异质关系的结构特征并提出了一个新颖的关系结构感知的异质信息网络表示学习模型(Relation Structure-aware Heterogeneous Information Network Embedding,简称RHINE)。通过对多个真实异质信息网络数据透彻的数学分析,本论文提出了两种结构相关的度量方法,这两种方法将异质关系一致地划分为两类:隶属关系(Affiliation Relations,ARs)和交互关系(Interaction Relations,IRs)。为了建模关系中有区别的特征,本论文提出两种特别设计的模型分别处理ARs和IRs,以此捕获网络拓扑结构和语义信息。最后,联合各个子模型统一训练优化RHINE。在四个数据集上,多个任务证明了 RHINE的有效性。更进一步地,网络的动态性和异质性是普遍共同存在的,即动态异质信息网络。动态异质信息网络的演变包括多类型节点和边的增加/删除,而一个微小变化会影响整个网络结构和语义信息的变化。为了捕获网络的动态演变,传统异质信息网络表示学习方法需要在每个时间步上重新训练,这是非常耗时且不切实际的。因此,为了研究网络的动态性和异质性,本论文提出了基于元路径相似性的动态异质信息网络表示学习算法(Dynamic Heterogeneous Information Network Embedding with Meta-path based Proximity,简称 DyHNE)。当网络动态演变时,DyHNE利用元路径增强的邻接矩阵捕获网络变化。然后通过解决广义特征值问题来学习节点表示,并利用特征值摄动计算节点表示的更新,而不需要重新训练模型。在三个真实动态异质信息网络上,多个任务结果表明模型在有效性和效率性上均优于最新方法。异质信息网络表示学习的强大建模能力也促进了工业界业务场景的发展。为了验证异质信息网络在真实应用场景中的有效性,本文进一步在微信“看一看”的文章推荐场景下,研究了好友增强的推荐问题,并提出社交影响力专注的神经网络(Social Influence Attentive Neural Network for Friend-Enhanced Recommendation,简称 SIAN)。为了融合异质信息,SIAN从异质社交网络的角度建模推荐场景,构建了注意力特征聚合器。更重要的是,SIAN设计了一个社交影响力耦合器,以捕捉好友推荐圈的影响力。实验结果表明,在两个真实数据集上,所提出的SIAN模型优于的最新的一些比较方法。
其他文献
古往今来,美术史上的动物画作层出叠现,国内外都有很优秀的动物题材绘画传统,其内容和表现方式源于绘画者对生活中事物的观察和理解。滇境作为我国珍稀野生动物种群的主要栖息地,是中国生物多样性最丰富的地区,其独特的地理位置和气候为野生动物的生存和繁殖提供了条件。然而,随着城市化的发展,生态环境不断恶化,人们为了追求经济利益最大化,不断对野生动物进行非法偷猎和捕杀,使得野生动物数量逐渐减少,许多物种濒临灭绝
本文为一篇英译中交替传译的口译实践报告,所描述的口译实践任务为本人负责口译的2018年亚洲城市与建筑国际学术年会中题为《设计能做什么》的演讲。本文对该实践项目进行了回顾,分析了这次实践中出现的各类问题和困难,并在释意理论的指导下对这些问题和困难做出分析,提出优化建议。在任务描述过程中,报告重点描述了译前准备阶段,详细介绍了译员的译前准备工作,突出了译前准备的重要性。在案例分析这一章节中,报告选取了
随着人们越来越关注个人的隐私信息,医疗环境下的相关隐私信息如何能够得到更加完善的保护也成为了研究的热点之一。由于医疗相关的可穿戴设备的数量随着物联网技术的发展越来越多,大量与用户相关的医疗隐私数据被保存在这些设备上,如用户生理信息、活动轨迹、睡眠情况等,对这些隐私数据的保护往往使用访问控制(Access Control)方法。而当前嵌入式设备由于资源受限的环境特点,无法完整的运行访问控制模型,因此
新疆古称西域,历史上就是少数民族的聚居地。作为边疆重地,从西汉起,汉族人口就陆续的迁入,大多是派驻西域的官吏和军队来保护领土完整和维护国家稳定。新中国成立后,为了促进新疆建设和发展,在政府的主导下,大规模的汉族移民从祖国各地来到新疆,在迁入新疆阿勒泰地区的汉族移民在同当地哈萨克族共同生活的几十年里,实现了民族间的互动和交融,民族关系也对当地社会的发展起到举足轻重的作用。本文主要研究新疆阿勒泰地区政
中国共产党自成立以来就高度重视理论学习。始终坚持理论学习是党在理论上不断取得创新成果的主要原因,也是党保持政治优势的重要法宝。延安时期中国共产党开展的马克思主义理论学习是一场大规模的理论学习运动,对加强党的思想建设和争取革命胜利产生了深远影响,在当时发挥了重要作用,在党的思想建设史上具有重要地位。研究这一理论学习运动,总结其历史经验,对于我们把握当前党的马克思主义理论学习具有重要的借鉴意义,更有利
目的:乳腺癌与糖尿病之间关系密切且复杂,相关影响因素繁多,为更好的理解两者之间的相关性,我们就糖尿病胰岛素治疗方面进行相关研究。首先我们进行细胞实验,选取乳腺癌耐药
近些年来,神经网络由于其对大量数据的学习能力而受到了学术界和工业界的热捧。在计算机视觉领域,通过对来自物理世界的干净图片添加细小的扰动就可以使得神经网络的识别能力完全失效。包括无人驾驶,人脸识别等神经网络的应用都受到了巨大的威胁。从2013年开始就有对抗样本的研究,关于新的更具威胁的对抗样本和如何抵御未知和现有的对抗样本的研究近些年来也是较为火热的话题。但是现有的关于对抗样本的应用与研究,大都是关
中国传统数学具有鲜明的特色,和古代西方数学截然不同,它是以计算为中心,实用性强。经过分析,本文认为中国古代的儒家思想,以农业为主的经济模式,以帝王君主为主的政治体制和
本文为一篇英译中交替传译实践报告,所描述的口译任务为笔者2018年完成的中美国际设计工作坊交传工作。笔者重点选取了“美国建筑教育”的讲座作为本次分析的对象,并从“释意理论”的角度出发,分析和讨论了一些典型案例,并进行了译文优化。在回顾任务过程中,报告主要从译前准备、译中过程和译后评估三个阶段详细介绍了口译实践的流程,并重点描述了译前准备阶段笔者的各类准备工作。在“案例分析”这一章里,报告紧密结合释
随着社会发展与进步,手机移动端的应用变得越来越广泛。目前,许多移动App在开发时,往往直接通过接口向底层服务发送请求,但随着公司业务越来越多,底层负责的数据处理和存储工