论文部分内容阅读
现实世界中,计算机视觉、数据挖掘、社群关系等领域中的各种数据与关系都可以用图/网络进行直观地表示。这些领域对数据分析的需求促进了图/网络的相关研究和进展,例如:节点分类、连边预测、节点相似度分析等。而与网络相关的研究中,网络表征又是所有研究工作的基础,是需要首先解决的问题。由于网络表征学习所具有的重要研究意义和应用价值,近年来这一方向吸引了越来越多研究者的关注。现存的绝大多数网络表征学习方法都基于同构网络,即节点类型相同,连边类型也相同的网络,但现实中更多的应用里,涉及到的实体和关系往往非常复杂,同构网络并不能描述这些不同类型的实体和关系之间的区别。因此为了更好地应用图表征解决实际应用工程中的问题,需要考虑面向异构网络的表征学习。现有的异构网络表征学习研究存在着两个主要的问题。首先,大部分异构网络表征只利用了异构网络中的异构信息和结构信息,忽视了节点的属性信息和结构的导出信息,这导致得到的网络表征存在着信息丢失;其次,对于不同的应用,各种信息的重要性不尽相同,而现有关于不同信息对生成异构网络表征的重要性和贡献的研究很少。本文工作主要围绕异构网络表征学习方法展开,主要贡献和创新点包括如下两个方面:·我们提出了一种带偏的随机游走方法,在这种方法中,我们通过控制随机游走生成的节点序列中节点类型的排序,保留网络的异构信息,同时我们往随机游走中添加受节点导出信息控制的偏置系数,从而保留网络中的结构导出信息。我们还提出了一种基于注意力机制的异构网络表征学习方法,通过设计的三种屏蔽矩阵,来同时保留网络的结构信息和异构信息。我们在这两种信息提取方法上进行了节点分类和聚类实验,实验结果证明了这两种方法在异构表征学习上的有效性。·我们提出了两种将多个不同异构网络节点表征融合为统一的网络表征的信息融合方法。我们提出的第一种信息融合方法基于自编码器。我们通过设计自编码器的目标函数,使同一个节点的不同表征在自编码器的编解码过程中渐渐在表征空间中靠近,从而使不同的节点表征融合得到单一表征。另外我们还设计了一种基于动态路由的信息融合方法,通过动态路由方法迭代计算为不同的节点表征计算重要性,同时将不同的表征融合成最终表征。我们在得到的节点最终表征上进行了节点分类、聚类、可视化实验和相似性分析的实验,结果表明我们的异构网络表征学习方法有着更好的表达能力。同时,我们还将融合后的表征与单一信息提取方法所得到表征进行对照实验,实验结果进一步验证了信息融合方法本身的有效性。