【摘 要】
:
作为工业信息化的重要技术,用于知识图谱构建的信息抽取技术可以从海量原始资料中系统化地获取并结构化地拼接工业领域知识。但在实际应用时,信息抽取技术却会遇到诸多困难。一方面,工业领域资料获取困难,且专业资料由于保密性等难以获取,使得信息抽取的数据资料来源难以确定。另一方面,在对数据资料进行信息抽取时,由于其得到的三元组的质量直接决定了所构建的知识图谱的质量。所以,如何通过任务的融合同步地抽取三元组中的
论文部分内容阅读
作为工业信息化的重要技术,用于知识图谱构建的信息抽取技术可以从海量原始资料中系统化地获取并结构化地拼接工业领域知识。但在实际应用时,信息抽取技术却会遇到诸多困难。一方面,工业领域资料获取困难,且专业资料由于保密性等难以获取,使得信息抽取的数据资料来源难以确定。另一方面,在对数据资料进行信息抽取时,由于其得到的三元组的质量直接决定了所构建的知识图谱的质量。所以,如何通过任务的融合同步地抽取三元组中的实体与关系是一个研究重点。针对这两个问题,本文在对现有算法的研究基础上,提出一种信息抽取框架,并对涉及算法提出针对性的改进方案,主要有以下研究内容:1)针对数据资料获取困难的问题,本文采用从开源资料库(如维基百科等)中获取相关资料的方式,通过LDA主题模型等文本挖掘算法对这些资料库中的海量数据进行处理,进而获取工业领域相关文本。本文从高频词与低频词两方面入手,通过改变其主题-词分布的方式提高LDA主题模型的文本分类效果。2)目前的信息抽取相关算法中,主要的研究目标为命名实体识别、关系抽取与实体关系联合抽取。其中,联合抽取的模型主要依靠两个子任务各自的模型研究进度。本文在两个子任务中分别研究了当前最受欢迎的算法模型,并在模型基础上做出了一定的改进。3)实体关系联合抽取是一个融合型任务,其关键点在于如何融合两个子任务间的相关性以获取更好的效果。本文在融合当前最好的命名实体识别与关系抽取模型的基础上,提出一种参数高度共享的实体关系联合抽取模型。实验表明,本文提出的实体关系联合抽取模型可以很好地实现对文本中的三元组进行抽取的效果。通过与其他模型的对比,验证了本文参数共享策略的有效性。另一方面,对本文提出的实体关系联合抽取模型的实验表明,本文所设计的从开放领域获取数据进而提取其中领域相关三元组的方式具有一定的效果,在工业信息化知识图谱构建中能起到良好的促进作用。
其他文献
在图像消旋领域,传统的消旋方法是通过软件或者硬件后处理的方式,在获取相机旋转角度后,通过图像旋转算法得到像素原先的位置,并对该位置进行对应像素的赋值操作,以此达到消
公路工程建设具有环境复杂、建设周期长、投资高、技术复杂等特点,建设过程中面临着大量质量风险因素。工程项目的实施阶段是工程质量形成的关键时期,也是项目全生命周期中质量风险危害程度最高的时期。对公路工程实施阶段质量风险评价管理进行深入研究,具有重要的理论和工程实践意义。本文以武汉机场快速路改线工程为依托,结合工程综合环境和施工技术资料,首先采用WBS法和德尔菲法相结合的方法对项目风险进行识别。为突出施
随着计算机技术的不断发展,医学影像技术也得到了更广泛的应用,该技术在生物工程学领域取得了巨大成就,并在临床诊断中占有着重要的地位。通过对医学CT图像的直接处理,能够得到初始的骨组织三维模型,但是,因为得到的三维模型存在边缘模糊以及表面粗糙等缺陷,导致直接生成的三维模型不能用于人工假体的制备。采用逆向工程技术,根据曲面分块原理对图像处理方法将得到的三维蒙皮数据进行曲面拟合,构建出股骨外轮廓的三维模型
中国汽车行业过去十年的高速增长逐步放缓,相关传统制造业进入新转型周期,以往汽车零部件生产高投入、低效益的粗放发展模式已经难以为继。随着国内外环境的重大变化,优化和调整企业发展战略是企业长远生存和发展的重大议题。中信戴卡公司作为全球最大的铝合金车轮制造商,一直致力于贯彻企业战略来发展和增强全球影响力和综合实力。根据企业转型发展和市场拓展的迫切需要,本文运用战略管理相关理论,在综合考虑企业内部环境和外
采用甲醛、环己酮、苯胺在酸催化下,合成了曼尼希碱类母体缓蚀剂,与甲酸衍生物及锑酸盐化合物两种高温缓蚀增效剂复配,制备出了超高温酸化缓蚀剂。室内高温高压动态腐蚀速率
黄土高原作为世界上水土流失最为严重的区域之一,森林覆盖率低,水资源十分短缺。长期以来,黄河流域水沙过程受气候变化与人类活动的共同影响,表现出显著的减少趋势。如何量化气候变化和人类活动对流域水沙变化的影响量,成为当前水文学研究的热点和难题。为此,本论文以黄河中游的清水河流域为对象,采用Mann-Kendall非参数检验、Mann-Kendall突变点检验法和累计距平法分析了清水河流域1960-201
随着我国综合实力提升,交通运输需求日益增长,桥梁结构也朝着更大跨径发展,大跨度桥梁多以缆索为主要受力构件。长期处于复杂环境和承受疲劳荷载,桥梁缆索内部钢丝容易发生腐蚀,且腐蚀后钢丝疲劳性能会大大降低,由此造成的断索乃至桥梁倒塌事故屡见不鲜。因此,发展一套针对桥梁缆索锈蚀疲劳的监测方法具有重大意义。本文针对平行钢丝索常见的锈蚀及锈后疲劳问题,提出基于压电陶瓷的高强钢丝锈蚀疲劳损伤监测方法,并在传统压
含氮化合物广泛存在于天然产物、药物、生物活性化合物以及有机材料中。喹喔啉-2(1H)-酮类衍生物是含氮杂环化合物中很重要的一类化学结构单元,特别是3-氨基喹喔啉-2(1H)-酮类化合物,其在抗菌,抗病毒等疾病治疗方面都有很好的应用。此外,咔唑及其衍生物具有独特的生物活性,如抗菌、抗炎、抗病毒、抗HIV等,其中吲哚[3,2-b]咔唑化合物具有π-共轭体系,可用于构建有机光电材料。含磷化合物不仅具有良
目的:分析佛山市心脏性猝死流行病学特征,发现区域性的心脏性猝死潜在危险因素及伴随疾病情况,为佛山市公众复苏策略提出建议,提高心脏性猝死救治能力。方法:研究对象是2016-2017年佛山市心脏性猝死患者,人口资料来源于佛山市统计局、佛山市公安局以及《国民经济和社会发展统计公报》,心脏性猝死资料来源佛山市疾病预防控中心统一收集的《居民死亡医学证明书》,其中病伤死因分类、编码和根本死因均采用《疾病和有关
衬砌是隧道结构的重要组成部分,关于衬砌的力学行为分析,是隧道结构和安全性分析的重要部分。围岩开挖后,其应力或位移将会释放,其应力或位移的释放并不是在开挖后即刻完成,