【摘 要】
:
问答系统能够满足人们想要快速、准确地获取信息的需求。虽然目前学者们对问答系统的研究已经取得了很大进步,但仍然存在一些问题。目前大多数的问答系统都是基于问题与问题之间的相似度,或者问题与答案之间的相似度,当用户提出的问题超出系统的训练语料库的范围时,会导致算法预测答案的准确度下降。为了解决这一问题,本文将知识图谱的信息应用于问答系统中以扩展问答系统的范围。同时,为了更好的利用和学习知识库的信息,本文
论文部分内容阅读
问答系统能够满足人们想要快速、准确地获取信息的需求。虽然目前学者们对问答系统的研究已经取得了很大进步,但仍然存在一些问题。目前大多数的问答系统都是基于问题与问题之间的相似度,或者问题与答案之间的相似度,当用户提出的问题超出系统的训练语料库的范围时,会导致算法预测答案的准确度下降。为了解决这一问题,本文将知识图谱的信息应用于问答系统中以扩展问答系统的范围。同时,为了更好的利用和学习知识库的信息,本文利用知识图谱的已知事实,结合答案选择(AS)和知识库问答(KBQA)的共同点,采用传统的问答模型来提高知识库检索的准确性。本文的主要内容包括以下几点:(1)AS-KBQA模型的设计:本文提出基于答案选择与知识图谱的问答模型,即AS-KBQA问答模型,该模型设计为三个模块:问题理解模块、答案选择模块和翻译模块。问题理解模块使用CNN与bi LSTM相结合的算法提取给定问题的实体以及问题与答案之间的关系,并通过大量的探索设计了一个提取实体的启发式算法。答案选择模块使用bi LSTM结合Attention和Soft Max的深度学习模型来选择一组候选答案实体。翻译模块包括三部分:1.使用BERT模型将知识库信息映射到向量空间,并将实体关系转化为空间向量;2.处理上两个模块传递来的数据;3.结合训练好的Trans R模型,检索出答案。(2)医疗领域知识图谱的构建:本文从两个大型的医疗网站中爬取了大量数据,并将收集到的数据进行处理,包括实体、数据属性、关系的处理操作,然后构建了一个中文的医疗领域知识图谱。针对AS-KBQA模型,本文进行了两个实验以验证其准确性和适应性。实验1:选择Freebase开源数据(英文)作为知识库,在Simple Question、Yahoo QA和Web QSP三个数据集上进行实验,并且选取了近几年提出的六个问答模型用作对比实验。以精度作为每个模型的评价指标,在FB2M和FB5M两个数据集上,本文的AS-KBQA模型具有更好的效果。实验结果证明了基于知识图谱的答案选择模型能够提高知识库问答的准确性。实验2;选择本文构建的医疗领域知识图谱(中文)作为知识库,在MIE数据集上进行实验以验证AS-KBQA模型的适应性,实验结果表明该模型不仅能适应英文问答,也可以适应不同领域的中文问答。因此,本文提出的AS-KBQA模型拥有高准确性和强适应性,只需要扩展知识图谱中的信息就可以扩展问答系统的应用范围。
其他文献
乘用车关门噪声不仅具备客观的声音特性,并且会体现出一定的心理方面的特性。汽车关门的声音是客户评价汽车质量优劣的重要因素,会对OEM企业(original equipment manufacture整车制造厂)的竞争产生重要影响。因而,乘用车车门声品质的评价和设计前期的性能仿真分析非常有意义。本文对影响关门声品质的因素进行了研究,并规范了关门声的评价方法,提出新的客观评价参数,并对关门声的前期开发中
松辽盆地位于我国东北地区,蕴藏着丰富的油页岩资源,油页岩主要发育在上白垩统青山口组一段。本文通过分析松辽盆地青一段油页岩的岩石学特征、工业品质特征、有机地球化学特征、生物标志化合物特征、沉积环境和空间展布规律,对东南隆起区和中央坳陷区青一段油页岩差异性进行分析,为松辽盆地油页岩的勘探与开发提供一定的科学依据。通过岩心观察及样品测试分析,认为松辽盆地青一段油页岩以灰黑色和深灰色为主,灰褐色次之,发育
地球化学勘查是利用地球化学数据和地球化学原理来研究某一地区地表或者地下情况的,但地球化学数据的收集非常的耗费人力与物力,尤其是在一些自然环境恶劣的情况下采集样品,其后还需对采集的样品进行分析,过程也非常的繁琐。遥感地球化学结合了地球化学方法与遥感技术的长处,既有遥感获取数据时间空间上的优点,又结合了化学元素分布规律;因此本文构建了一种遥感地球化学反演模型。由于遥感数据存在数据量大且冗余数据过多,呈
交通标志可以使驾驶员快速地感知道路交通信息,并有效降低交通事故的发生概率。交通标志通常都会被设计为显眼的颜色,但天气、光照等条件的不同使得驾驶员在较复杂的自然场景下很难去集中注意力分辨出每个交通标志的类别。此外,汽车上的行车摄像机需要在高速行驶中捕捉到交通标志的影像,而绝大多数情况下行车摄像机所记录的交通标志影像对于整张图像属于十分微小的目标,对于它的定位及识别面临着巨大的困难。因此,如何在自然场
当前信息时代的不断发展,传统的编辑出版行业也面临着巨大的挑战和变化。在期刊编辑工作中广泛运用网络技术,已经成为了一种新型的传媒形式,这样的传媒方式与传统的期刊传媒方式相比,具有很大的优势,并且更加便捷。在新媒体的大环境下,不仅要对一些优秀的传统编辑思路进行传承,更要在此基础上有一定的创新。本文分析了新媒体与传统期刊的优劣势以及在新媒体环境下传统期刊编辑工作面临的挑战,然后从多个方面对新媒体环境下传
新疆东天山觉罗塔格成矿带位于西伯利亚板块与塔里木板块的聚合地区,其中的阿奇山铅锌矿位于新疆吐鲁番地区鄯善县东南方向,大地构造位置位于东天山觉罗塔格成矿带阿奇山-雅满苏岛弧火山带。自2013年发现以来学者们对矿床地质特征、地球化学特征以及矿区周围的花岗岩年龄等进行了探讨。本文在对阿奇山铅锌矿床地质特征研究的基础上,采用电子探针成分分析和原位LA–ICP–MS微量元素分析方法对与成矿关系密切的石榴子石
古利库金矿床位于黑龙江北部,地处兴蒙造山带东端,兴安地块北东部,成矿区划属嫩江古生代、中生代Mo、Au、Cu、Pb、Zn(Ag)成矿带。作者在系统收集整理前人研究成果的基础上,通过野外调查和室内测试分析,对该矿床的成矿地质背景、矿化地质特征、成矿岩浆岩特征、矿石稳定同位素组成、流体包裹体特征等开展了系统研究,确定其为浅成低温热液型矿床成因。论文研究取得如下认识及成果:古利库金矿床的金矿化表现为含碳
钴作为稀贵金属,是我国重要的战略矿种之一。西秦岭地区是我国钴矿集中发育地区,钴主要作为伴生矿产,产于铜多金属矿床中。近年来在矿产勘查过程中,发现喜集、张坪等具有工业价值的钴矿床,表明研究区具有钴矿找矿潜力。作者通过参加“甘肃西秦岭钴金综合信息预测及大桥金锑矿田构造解析”及“钴矿成矿规律总结与典型矿床研究”课题研究,以喜集钴多金属矿为重点,总结了成矿地质特征、成矿地质条件及找矿标志,开展区域及矿区钴
翠宏山铁铜多金属矿床位于小兴安岭-张广才岭成矿带,是上世纪60年代在中国东北小兴安岭地区发现并勘探出的与中生代岩浆侵位作用有关的大型矽卡岩矿床,该矿床自发现以来吸引了众多学者对其成矿作用以及矿床成因等问题的关注与研究。本文在前人研究的基础上,对该矿床的矿床地质特征、流体地质学、成岩成矿年代学以及同位素地球化学等进行综合分析,研究结果揭示:(1)矿区内出露的侵入体主要有早古生代黑云母花岗岩和正长花岗
自二十一世纪以来,全球常规能源巨大的消耗带来了明显的供需紧张问题,但技术的进步使得非常规油气领域取得了一定的进展,未来预计可以有效地来缓解常规资源紧张的问题。在非常规资源中,油页岩近年来更是备受关注。油页岩可通过高温加热促使其中的干酪根分解产生油页岩油。以往采用的地表干馏的方法需要将油页岩开采出来,在地面进行高温干馏和进一步的加工,但是该方法仅可用于浅层易开采的油页岩层,且干馏产生的废气等对环境有