基于知识表示学习的知识图谱补全算法研究

来源 :西南科技大学 | 被引量 : 1次 | 上传用户:wjh75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱(Knowledge Graph)以三元组形式描述了客观世界中的概念、实体及其之间的关系,为自动理解海量信息提供了一种更好的表达形式。在使用大规模知识获取方法构建的知识图谱中通常存在大量关系缺失问题,如Freebase中71%的实体缺少出生地相关信息,Word Net和NELL也有着不同程度的词性、父母等关系缺失,缺失的关系会降低下游应用任务的精度。知识图谱补全是针对这一问题提出的自动补全方法,主要有基于符号推理、基于链路预测和基于知识表示学习的方法。基于符号推理的方法主要依赖于人工先验规则,推理效率低,无法适用于大型的知识图谱。基于链路预测的方法是利用网络拓扑结构,假设相似节点最有可能形成链接,但知识图谱中链接具有明确的语义信息,使得链接预测效果往往不理想。基于知识表示学习的补全是一种结合表示学习和链路预测的方法,采用数值推理替代符号推理,为大规模知识库的补全提供了一种高效的方式。论文针对知识表示学习补全方法中的计算效率和结构化信息考虑不足的问题,开展了三个方面的研究。(1)针对现有网络表示学习在链路预测中节点间关系考虑单一、计算效率低的问题,利用网络中节点之间的共同邻居的“资源分配”刻画节点之间的相似度,并将相似的节点映射到相近的向量空间中来学习节点的表示,提出了一种基于资源分配的针对链路预测网络表示学习方法(NELP)。(2)针对现有知识表示学习模型越来越复杂、参数过多的问题,利用知识图谱中的关系类型约束信息定义了关系类型评分函数,并将该评分函数与Trans E的评分函数相结合,提出了一种基于关系类型约束先验信息的知识表示学习方法(Trans RT)。(3)针对现有知识表示学习模型评分函数单一、结构化信息考虑不足的问题,利用概率有向图模型提出了一种结构化概率评分函数,利用有向概率图模型来对评分函数1)(?,,)进行建模,提出了一种基于概率图模型的知识表示学习方法(PGME)。论文在公开数据集上验证了提出的方法,NELP在6个真实网络数据上的链路预测精度均有所提高,且该方法对向量维度不敏感,具有较好的稳定性。Trans RT和PGME在5个来自Free Base和Word Net的数据集上进行了验证,实验结果表明,Trans RT在不改变模型参数数量的情况下,提升了简单模型知识图谱的补全效果;PGME在不存在可逆关系对的图谱中补全效果提升更为明显,能较好刻画出知识图谱中的结构信息。
其他文献
环氧化合物是一种重要的化工中间体,广泛应用于精细化工、石油化工和有机合成等领域,主要由烯烃选择性氧化反应获得。在诸多制备方法中,过氧化氢法最为绿色、清洁、经济,且受
页岩气已经成为目前很重要的非常规油气资源。近期在湖北宜昌的勘探表明该地区也有很好的页岩气潜力。地应力分布是页岩气开发中重要基础数据。而湖北宜昌页岩气资源分布区地
改革开放以来,针对我国地区发展不平衡问题,中央政府先后实施了开放东部沿海城市、促进中部地区崛起、推进西部大开发、振兴东北老工业基地等一系列发展战略。随着这些政策的
我国近年来大力提倡大众创业、万众创新,以促进中国经济的转型升级。“双创”是新时代中国经济实现新飞跃的有力依托,是新时期推行创新驱动的重要载体。随着“双创”战略的不断推进,各种优惠政策频频出台,越来越多的人投入到创业中去,其中不乏一些掌握核心技术的发明家创始人。这类创始人具有较强的创新意识与创新能力,在企业上市后也同样会积极投入到企业的研发中去。发明家创始人既具有发明家的身份,也具有企业管理者的身份
债务融资作为我国上市公司的外部融资方式,具有其普遍性和重要性:它是我国上市公司最主要的资金来源渠道。企业债务融资能够调节融资结构,减少财务成本,增加企业利润。同时进
随着互联网的发展,网络已经成为大众生活中不可或缺的要素。地方新闻网站经过多年的发展,已成为了政府服务社会大众的重要平台,其网站影响力也成为地方新闻网站建设的重要内
碳酸盐岩储层的形成保存机理和非均质性问题一直是储层成岩作用研究的重点。基于岩心、薄片、物性及地球化学分析等资料,以鄂尔多斯盆地中部马五6-10为例,研究与蒸发环境相关
铝合金具有密度低、塑性高、抗腐蚀性能好等优点,在航空航天、航海船舶、汽车、高速动车及其它机械制造领域中得到广泛应用。铝合金材料在腐蚀性环境中往往会很容易形成电化
电磁诱导透明(EIT)现象最早在量子系统中被发现,其原理是量子间发生了相消干涉,导致本来应该被材料吸收的电磁波可以透过材料进行传输。这种现象存在很广阔的应用前景,但是因
近年来,随着移动互联网和物联网等新一代信息技术的迅猛发展,移动通信的业务类型不断增加,为满足海量终端连接对系统容量和传输速率的要求,异构网络(Heterogeneous Network,HetNet)应运而生,该技术通过在宏蜂窝网络范围内大规模部署低功率节点,为用户提供更优质的服务体验。由于移动网络流量具有明显的时空不均匀性,各类型基站在大部分时间里都处于低负载状态,这就导致了严重的能耗问题,在此