【摘 要】
:
近年来,关于包含不同类型的实体和关系的异质信息网络(Heterogeneous Information Networks,HIN)的研究兴起,特别是知识图谱的出现和完善加快了异质信息网络下相关算法的研究
论文部分内容阅读
近年来,关于包含不同类型的实体和关系的异质信息网络(Heterogeneous Information Networks,HIN)的研究兴起,特别是知识图谱的出现和完善加快了异质信息网络下相关算法的研究进展。在这种网络中已经探索了许多数据挖掘任务,其中,预测实体之间潜在关系的.链接预测是重要任务之一,是解决异质网络中很多其他问题的基础。关系推理是指通过对异质网络中复杂的网络结构和多样的语义含义分析和挖掘,推理出网络中的潜在关系。它是解决链接预测任务的指导方法。本文首先研究了为关系推理服务的实体相似度度量这个基础性问题,提出了一个基于蒙特卡洛模拟的随机路径采样算法——RSSim,来解决传统基于矩阵链式乘法的算法(如PCRW和HeteSim)在时间效率与内存消耗上的问题。本文还给出了随机游走样本数取值的理论证明,并通过实验证明了仅使用一小部分采样样本足以保证相似度排名的准确率,同时给出了相似度误差设置的经验公式。主流的基于路径特征的关系推理方法是路径排序算法(Path Ranking Algorithm,PRA)。它通过两步算法来完成链接预测任务,第一步是用图上的遍历算法来找到所有的元路径作为特征,第二步是通过元路径受限的随机游走算法训练一个关系分类模型。本文在RSSim的基础上提出了一个新颖的关系推理方法——子图路径抽取算法。它将PRA算法的特征选择和特征计算两步在逻辑上进行综合,用实体子图搜索与合并的方式构造特征,大大节省了计算过程的时间开销。为了满足大规模知识图谱下的关系推理需求,本文还提出了子图路径抽取的分布式计算方法。该分布式算法包括两步:分布式子图路径特征计算与分布式多模型训练。并行的算法解决了单机训练各个模型的低效率问题,在分布式系统下,按照关系划分的多个模型将同时训练,极大提高了效率。
其他文献
从二十世纪初开始,微分方程边值问题逐渐成为了微分方程研究中的热门问题,特别是Dirichlet、Neumann等边值问题解的存在性以及多解性。数年来,由于在物理学、航天、生物学等
质量是企业的核心竞争力。随着世界经济形势的变化,科技水平显著提高,目前国内国外相当多的产业都逐步形成了买方市场,使得产品无论是在国际市场还是在国内市场都面临着激烈
21世纪是知识经济时代,伴随着互联网技术、网络通信技术的发展,传统的信息服务和信息获取方式受到了革命性的冲击,信息环境和信息服务发生了巨大的变化,用户信息需求开始由信
具备比强度高、比模量高、抗氧化和密度低等特性的SiC_f/SiC复合材料逐渐成为制备航空燃气发动机热端构件的热点材料。在发动机实际服役的燃气环境中,SiC_f/SiC性能会急剧衰退。在SiC_f/SiC表面制备环境障碍涂层(Environmental barrier coating,EBC)是防止其在燃气环境下性能衰退的主要途径。目前,广泛应用的稀土硅酸盐EBC存在制备温度过高和缺陷过多等缺陷,需
小学语文课堂“八环节”模式是宁夏石嘴山市第十三小学根据“生本教育”的理念,在“先学后教,以学定教”的基础上提出来的,并在该校乃至所在县区的部分学校中进行实践。本论文以语文课堂“八环节”模式为研究对象,对“八环节”模式在语文课堂运用中出现的问题进行分析,并提出相应的改进措施。具体如下:绪论从选题背景、研究意义、研究现状、研究方法四个方面出发,对论题进行阐述。第一章介绍小学语文课堂“八环节”模式的概念
太阳磁场在太阳物理研究中具有重要意义,对太阳磁场的高分辨观测图像是研究太阳小尺度活动的主要依据。NVST目前已经能够对太阳进行高分辨的成像观测,正在进行高分辨磁像仪的
随着信息社会的高速发展,信息传播越来越趋向于多维化,互联网作为飞速发展的新媒体,在信息传播方面功不可没。社交网络的出现改变了人们获取信息的方式,使得消息交换和共享变
锂-氧电池具有极高的理论比能量密度(3505 Wh kg–1,基于产物Li2O2),可以满足未来长续航里程电动汽车的使用,因此被看作是下一代电池技术。然而,由于锂-氧电池产物Li2O2较差
当前,我国正大力实施机构改革,积极转变政府职能,将原来分散的登记机构、登记职能等加以整合,以保障不动产统一登记制度顺利实施,是实施不动产统一登记的重点、难点。本文以
硫化氢(H_2S)在心血管系统中表现出广泛的保护作用,例如抗炎症和促进新生血管生成。但由于H_2S的半衰期短且释放行为不可控,其治疗性应用受到了严重的限制。本文通过在部分氧化的海藻酸钠(ALG-CHO)上修饰2-氨基吡啶-5-硫代甲酰胺(APTC,一种小分子H_2S供体)来模拟内源性H_2S的缓慢持续释放。此外,在体系中引入苯胺四聚体(TA,导电低聚物)和脂肪间充质干细胞(ADSCs),利用ALG