论文部分内容阅读
随着互联网设备和移动终端的普及,大数据时代已经深刻地改变了人们的生活方式,人们利用互联网便捷地进行教育、医疗、购物、娱乐等活动,与之相伴而生的是海量的数据。其中,图数据广泛存在于各个场景中,例如,金融网络、社交网络、医学图谱等,它们往往具有规模庞大、结构复杂、信息多元等特点,造成对其分析的过程中,无论是算法性能还是时间成本都不尽人意,严重影响着相关任务的整体表现。为有效且高效地处理图数据以克服上述挑战,并且将其应用到不同场景下支撑不同的下游任务,提高图数据地可用性,本文主要完成的工作如下:
(1)针对图数据所具有的高维、稀疏等特性,提出一种基于扩散机制的图表示学习方法。该方法受到扩散现象的启发,利用扩散系统描述图上的信息流动,以更好地建模图上的全局、局部特性。为建立图的特征属性与结构属性的关联,提出了一种启发式的图结构自精细化算法,使节点表征结果反馈到图结构上。此外,引入了度惩罚以确保节点表征可以在表征空间保持真实图的无标度特性。大量对比实验、可视化实验分析充分验证了所提出模型的有效性;
(2)针对零样本学习中类别模板分布不规则,及类别-属性矩阵所描述的具有节点异构二部图的图表示学习问题,提出了一个两阶段网络――DAGDA(Discriminative Anchor Generation and Distribution Alignment Model)。在第一阶段,该网络扩展了谱域图卷积网络,在同质化异构图上进行节点信息聚合,以输出强判别力的类别表征。在第二阶段,提出了自编码器架构下的投影网络,以实现零样本条件下的分类。与此同时,为第二阶段网络施加了关系正则约束,从更细的粒度上对齐了样本在属性空间和表征空间的分布。为评估模型性能,本文进行了大量对比、消融实验,结果表明DAGDA可以在多个数据集上媲美当前最好算法;
(3)针对推荐系统中常面临的稀疏、冷启动问题,通过引入知识图谱作为辅助信息,提出知识兴趣网络――KIN(Knowledge Interest Network)。该网络在一个框架下,端到端地学习知识图谱中的实体表征和推荐系统中的预测任务。为学习实体表征,本文构建了一种空域图卷积网络,以提高图卷积操作在大规模图数据上的效率。此外,为实现更好地图卷积效果,提出一种基于实体翻译的注意力机制,用以在用户和物品两端进行高效的信息聚合。模型在标准数据集上的评估结果显著优于近期推荐算法,从而验证了其有效性。
(1)针对图数据所具有的高维、稀疏等特性,提出一种基于扩散机制的图表示学习方法。该方法受到扩散现象的启发,利用扩散系统描述图上的信息流动,以更好地建模图上的全局、局部特性。为建立图的特征属性与结构属性的关联,提出了一种启发式的图结构自精细化算法,使节点表征结果反馈到图结构上。此外,引入了度惩罚以确保节点表征可以在表征空间保持真实图的无标度特性。大量对比实验、可视化实验分析充分验证了所提出模型的有效性;
(2)针对零样本学习中类别模板分布不规则,及类别-属性矩阵所描述的具有节点异构二部图的图表示学习问题,提出了一个两阶段网络――DAGDA(Discriminative Anchor Generation and Distribution Alignment Model)。在第一阶段,该网络扩展了谱域图卷积网络,在同质化异构图上进行节点信息聚合,以输出强判别力的类别表征。在第二阶段,提出了自编码器架构下的投影网络,以实现零样本条件下的分类。与此同时,为第二阶段网络施加了关系正则约束,从更细的粒度上对齐了样本在属性空间和表征空间的分布。为评估模型性能,本文进行了大量对比、消融实验,结果表明DAGDA可以在多个数据集上媲美当前最好算法;
(3)针对推荐系统中常面临的稀疏、冷启动问题,通过引入知识图谱作为辅助信息,提出知识兴趣网络――KIN(Knowledge Interest Network)。该网络在一个框架下,端到端地学习知识图谱中的实体表征和推荐系统中的预测任务。为学习实体表征,本文构建了一种空域图卷积网络,以提高图卷积操作在大规模图数据上的效率。此外,为实现更好地图卷积效果,提出一种基于实体翻译的注意力机制,用以在用户和物品两端进行高效的信息聚合。模型在标准数据集上的评估结果显著优于近期推荐算法,从而验证了其有效性。