论文部分内容阅读
网络表示学习的快速发展为网络数据分析提供了新颖的研究思路,有效提升了数据挖掘任务的表现。传统网络表示学习方法大多聚焦于静态、同质的信息网络,即假设网络是静止不变、节点和边类型单一。然而,真实世界的网络往往是动态变化、节点和边类型多样的,即所谓的动态、异质信息网络,这使得传统方法无法有效建模网络的真实特性,学到的节点向量表示很难适用于真实场景。因此,本文立足于研究动态、异质的信息网络表示学习算法。具体而言,本文首先研究了网络的动态性问题,并提出结合微观和宏观动态性的动态网络表示学习算法M2DNE。其次,本文研究了网络的异质性问题,并提出关系结构感知的异质信息网络表示学习算法RHINE。然后,本文研究了网络的动态性和异质性问题,并提出了动态异质信息网络表示学习算法DyHNE。最后,本文在微信“看一看”的文章推荐场景下,研究了好友增强的推荐问题,并提出社交影响力专注的神经网络SIAN,以验证异质信息网络表示学习在真实场景下的有效性。真实世界中,动态网络是非常常见的,其通常随着时间在微观和宏观层面不断演化。微观动态性细致地描述了网络结构的形成过程,而宏观动态性表示网络规模的演变模式,两种动态性都是刻画网络演变的重要因素。但是,如何准确地在网络表示学习中捕获两者,尤其是宏观动态性,还没有被很好的研究。因此,为了研究网络的动态性问题,本论文提出了结合微观和宏观动态性的动态网络表示学习算法(Temporal Network Embedding with Micro-and Macro-Dynamics,简称M2DNE)。对于微观动态性,M2DNE构建时序注意力点过程来捕获网络结构的形成过程。对于宏观动态性,M2DNE定义由网络嵌入表示参数化的的动力学方程。时序动态网络中,微观动态性和宏观动态性的交互的演变交替地影响节点表示的学习过程。在三个真实的动态网络上,丰富的实验验证M2DNE显著地优于最新方法。另一方面,信息网络往往是异质的,即网络中包含多类型的节点和边,称作异质信息网络。现有的大多数异质信息网络表示学习方法通常使用单一模型不加以区分地建模所有关系,这必然会削弱网络嵌入表示的能力。因此,为了研究网络的异质性问题,本论文考虑了异质关系的结构特征并提出了一个新颖的关系结构感知的异质信息网络表示学习模型(Relation Structure-aware Heterogeneous Information Network Embedding,简称RHINE)。通过对多个真实异质信息网络数据透彻的数学分析,本论文提出了两种结构相关的度量方法,这两种方法将异质关系一致地划分为两类:隶属关系(Affiliation Relations,ARs)和交互关系(Interaction Relations,IRs)。为了建模关系中有区别的特征,本论文提出两种特别设计的模型分别处理ARs和IRs,以此捕获网络拓扑结构和语义信息。最后,联合各个子模型统一训练优化RHINE。在四个数据集上,多个任务证明了 RHINE的有效性。更进一步地,网络的动态性和异质性是普遍共同存在的,即动态异质信息网络。动态异质信息网络的演变包括多类型节点和边的增加/删除,而一个微小变化会影响整个网络结构和语义信息的变化。为了捕获网络的动态演变,传统异质信息网络表示学习方法需要在每个时间步上重新训练,这是非常耗时且不切实际的。因此,为了研究网络的动态性和异质性,本论文提出了基于元路径相似性的动态异质信息网络表示学习算法(Dynamic Heterogeneous Information Network Embedding with Meta-path based Proximity,简称 DyHNE)。当网络动态演变时,DyHNE利用元路径增强的邻接矩阵捕获网络变化。然后通过解决广义特征值问题来学习节点表示,并利用特征值摄动计算节点表示的更新,而不需要重新训练模型。在三个真实动态异质信息网络上,多个任务结果表明模型在有效性和效率性上均优于最新方法。异质信息网络表示学习的强大建模能力也促进了工业界业务场景的发展。为了验证异质信息网络在真实应用场景中的有效性,本文进一步在微信“看一看”的文章推荐场景下,研究了好友增强的推荐问题,并提出社交影响力专注的神经网络(Social Influence Attentive Neural Network for Friend-Enhanced Recommendation,简称 SIAN)。为了融合异质信息,SIAN从异质社交网络的角度建模推荐场景,构建了注意力特征聚合器。更重要的是,SIAN设计了一个社交影响力耦合器,以捕捉好友推荐圈的影响力。实验结果表明,在两个真实数据集上,所提出的SIAN模型优于的最新的一些比较方法。