面向知识图谱扩充的知识获取关键技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hopemaoelgin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是一种使用图结构数据模型集成数据的知识库。它将现实世界中无结构化的数据转换为了三元组结构化的知识,这种可解释的结构化语义知识是构建智能机器的重要因素,同时也是人工智能应用发展的基础数据资源。虽然现有许多知识图谱已具有千万甚至十亿级别的三元组,但其仍然存在很大程度的不完整问题,从而严重影响了相关应用的性能。作为提升知识图谱完整性的重要手段,知识获取受到了研究人员的广泛关注,并已发展成为知识图谱领域的重点研究方向之一。知识获取旨在从数据源中获取三元组。当前数据源主要有两类:一类是蕴含着海量信息的自然语言文本;另一类是包含着大量隐含信息的知识图谱。根据这两类数据源,知识获取通常包含以下三个关键技术:面向知识图谱的实体链接、面向知识图谱的关系抽取和面向知识图谱的知识推理。其中,第一个技术旨在从文本中找出实体。第二个技术旨在识别出文本中实体之间的关系,并构成三元组。第三个技术旨在根据知识图谱中已知的三元组挖掘出隐含的三元组。虽然国内外研究人员已经在知识获取研究上取得了一定的成果,然而现有研究成果在知识图谱自身特征的利用,以及模型的设计方面仍然存在很多不足。因此,本文针对现有研究成果的不足,深入研究了知识获取的三个关键技术,并取得了以下研究成果:(1)针对面向知识图谱的实体链接,提出了一种结合共同注意力机制与图卷积神经网络的实体链接方法。现有基于神经网络的实体链接方法忽略了序列性实体指称项上下文与图结构化实体上下文的语义鸿沟,从而影响了实体链接的准确率。观察发现,实体指称项上下文中单词的重要性是不同的,实体上下文中内容的重要性也是不同的。为了解决上述问题,本文提出了一种结合共同注意力机制与图卷积神经网络的实体链接方法。该方法采用共同注意力机制建立实体指称项上下文与实体上下文之间的相关性,以缩小两者之间的语义鸿沟,并对两者中的重要内容进行同时建模。在此基础上,提出了一种上下文感知图卷积神经网络(Context-AwareGraphConvolutionalNetwork)用于学习实体上下文的图拓扑结构特征。在五个公开数据集上的实验结果表明,所提方法的准确率、召回率和F1值均高于对比方法。(2)针对面向知识图谱的关系抽取,提出了一种基于编码器-解码器框架的远程监督关系抽取方法。现有远程监督关系抽取方法往往忽略了实体对可能具有多个关系的事实,从而严重影响了关系抽取的准确率。观察发现,实体对具有的多个关系之间往往具有依赖性。为了解决上述问题,本文提出了一种基于编码器-解码器框架的远程监督关系抽取方法。该方法在编码器端采用卷积神经网络提取给定实体对对应的句子包特征,在解码器端采用长短期记忆网络预测给定实体对的关系,并以条件概率的方式对关系之间的依赖进行建模。另外,将注意力机制引入框架,以突出尚未预测出的关系对应的句子特征。针对编码器-解码器框架直接用于关系抽取时无法训练的问题,提出了一种称为信息量的度量方法。该方法对训练句子包对应的每个关系的信息进行量化,并根据信息量的降序确定关系的训练顺序。在被广泛应用的公开数据集上的实验结果表明,所提方法在准确率和召回率上的结果均优于对比方法。(3)针对面向知识图谱的知识推理,提出了一种基于卷积神经网络的路径增强的知识推理方法。现有基于卷积神经网络的知识推理方法忽略了实体之间的路径信息,从而严重影响了知识推理的准确率。观察发现,从局部和全局角度分别来看,每个路径对关系的重要性是不同的。为了解决上述问题,本文提出了一种基于卷积神经网络的路径增强的知识推理方法。该方法在知识推理过程中引入了路径信息,并考虑了路径的局部和全局重要性。为了计算路径局部重要性,提出了一种基于注意力机制的方法。为了计算路径全局重要性,设计了一种度引导的逆路径频率指数(Degree-guidedInversePathFrequency)。在四个公开数据集上的实验结果表明,所提方法在两个常用评测任务,即链接预测和三元组分类上的表现优于对比方法。
其他文献
平顶山煤业(集团)土木建筑工程有限公司,是1957年为开发建设新中国成立后第一个大型煤炭基地—平项山矿区而成立的煤炭建筑企业。成立50多年来,先后建成了平顶山矿区15对年产60~300万吨矿井的地面生产建筑和服务设施,承建了6座180~340万吨大型选煤厂,完成了4座坑口电站,建设了60万吨和80万吨的焦化项目2座等等。现有职工2016人,是平顶山市的骨干建筑企业,
研究目的:本研究借鉴国外拳击运动员专项身体素质训练方法,结合我国男子拳击运动员身体条件,探讨我国优秀男子拳击运动员专项身体素质特点,选出专项身体素质指标定量分析,并进行运动成绩评价标准测量与分析,确定我国优秀男子拳击运动员专项身体素质测试指标,为我国优秀男子拳击运动员专项身体素质测试提供参考,为我国男子拳击运动员选材、训练提供科学依据。研究方法:采用文献资料法、专家
“动量效应”是存在于各种股票市场中的最典型的金融异象。动量似乎违反了最弱有效市场假说形式。假设资产的价格能够快速正确地响应新信息,那么过去的收益则不能预测未来的收益,如果证券市场上存在动量效应,那么可以通过构建动量投资组合,获得超额收益。国外学者在对整个国际证券市场的动量效应进行研究时发现,动量效应是显著存在的,这一发现对有效市场假设理论发出了挑战,然而在研究中国股票市场上,发现对动量效应的存在性
一、瞿秋白的拉丁化新文字研究与创制的瞿氏方案瞿秋白的汉语言研究,可追溯到其常州府中学堂(即江苏省立第五中学)时期。但真正确立以文化救中国的人生抱负和宏伟志向,还是在1920年底出国途中撰写的《饿乡纪程》里,即担一份中国再生时代发展的责任而为大家辟一条光明的路。1929年2月,瞿秋白在第二次赴俄期间因肺病复发、加重,不得不到莫斯科南
运载火箭燃料一般具有剧毒或易燃易爆等特性,因此推进剂自动化加注技术得到了各国广泛的关注。火箭燃料加注的自动化本质上就是实现地面与箭上脐带连接器的自动对接和脱落。然而,由于受风载的作用,箭上脐带连接器接口会随箭体作一定的摆幅运动,因而自动脐带连接器需具备动态对接和随动能力,这使得自动脐带连接器系统的设计与控制变得十分困难。本文以某运载火箭脐带连接器的自动对接任务为研究
川滇地块位于青藏高原东南缘,是晚新生代以来青藏高原东南向扩展的重要组成部分,也是研究高原隆升模式和生长变形过程的重要窗口。小金河-箐河构造带(北支为丽江-小金河断裂、南支为金河-箐河断裂以及程海断裂)斜切川滇地块,前人研究认为该构造带对青藏高原的东南向扩展具有屏蔽和吸收作用,但其深部驱动机制及动力学过程并不清楚,同时研究区一带地震频发,其孕震背景还有待进一步梳理。本
目的:多峰宽带强生命能量纳米波(以下简称:多峰能量波)照射治疗运动神经元病的理论基础部分是参考文献,其主要作用是提供多峰能量波治疗外伤及术后切口的愈合的临床研究报告;依据参考文献资料所引出的结论:多峰能量波有改善血液循环,消除微循环障碍,加速手术后伤口的愈合,修复受损伤的组织细胞的目的。方法:采用多峰能量波照射肾俞穴、心腧穴、脾腧穴头面部及患部治疗运动神经元病。结果
日本国政选举主要包括众议院、参议院大选和统一地方选举。日本共产党高度重视马克思主义关于资本主义选举是无产阶级革命新的武器等相关论述,积极投身于日本国政选举中。自2008年世界金融危机以来,日本举行了七次大选,日本共产党针对每次大选的不同特点,采取了诸如分析对手弱点、制定选举目标、加强选战动员等措施,但由于全球保守主义抬头、自民党势力强大、右翼土壤深厚、自身实力弱小等
风噪是影响汽车高速行驶时乘坐舒适性的重要因素。本文以某款车型外后视镜为例,利用CATIA软件对外后视镜安装座外形进行多种方案优化,同时借助CFD软件对多种方案进行分析,得出在降低镜臂厚度到34mm,增大镜体与安装座距离5mm,且绕Y轴旋转4°,并绕Z轴旋转6°条件下,能够对风噪性能进行有效降低,提升驾驶人员高速行驶时的舒适感。
随着自动化技术与总线技术的发展,阀岛从最初的电磁阀组演变到今天的总线型阀岛。本文介绍了总线型阀岛结构,特点和应用,供同行参考。