基于深度学习的知识问答研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:lobohzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识问答的目的是根据用户提出的自然语言问题,基于知识库给出精确的答案。近些年数据挖掘、信息抽取技术的快速发展,推动了大规模且涵盖领域丰富的知识库的涌现,为基于知识库的问答研究提供了数据基础。由于自然语言问题表达方式的多样性,如何获取问题中的主题实体,并精确的将自然语言问题和知识库中的结构化三元组进行匹配是本文研究的重点。本文将知识问答任务分为两个阶段:主题实体识别和候选三元组排序。在主题实体识别阶段首先使用基于深度学习和迁移学习的实体识别模型得到问题的主题实体;在候选三元组排序阶段分别计算问题和候选三元组的语义相似度和字符相似度,并通过融合进行排序。NLPCC-ICCPOL 2016 KBQA任务发布了大规模的中文知识库和相关的问答数据集,本文在该数据集上进行实验并取得了出色的成绩。本文的主要贡献如下:本文提出迁移深度实体识别模型,将迁移学习和深度学习结合起来用到命名实体识别中。通过将外部中文分词工具的词性标注结果融入到实体识别训练的输入中,解决实体识别数据集过小的问题。并且在双向长短时记忆网络(Bi-LSTM)和条件随机场(CRF)之间加入多头注意力机制提取问题中任意两个字符之间的语义关系,从而获取整个问题的内部语义信息,有效提高实体识别的准确率到91.71%。在问题和三元组语义匹配时,为了捕捉问题中的重要信息且充分利用知识库中的信息,在计算问题语义向量时加入知识库感知注意力机制。知识库感知注意力由自注意力(Self-attention)和加注意力(Add-attention)两部分构成。自注意力用来对问题的语义矩阵进行特征向量转化,加注意力利用知识库中主题实体相连的谓语信息获得问题的重要关注点,最后结合问题的重要关注点和语义矩阵得到问题的语义向量。实验结果表明,知识库感知注意力机制在F1上提高1.97%。本文提出双层次语义匹配模型,模型分别从语义相似度和字符相似度两个角度获取问题和三元组的相似性,可以解决单一相似度无法充分挖掘相似性的问题。在语义相似度计算上利用Bi-LSTM和知识库感知注意力机制得到问题和候选三元组的语义向量表示,通过两者语义向量的联系结合全连接网络获取语义相似度。在字符相似度计算上首先构建问题和候选三元组的字符相似矩阵,然后通过卷积神经网络(CNN)进行特征的提取,最后结合最大池化和全连接网络计算问题和三元组的字符相似度。实验证明,单独使用语义相似度和字符相似度进行语义匹配时,其F1分别为81.72%和78.61%,通过融合语义和字符相似度后F1可以提高到82.74%。本文共有图31幅,表19个,参考文献86篇。
其他文献
全球化背景下,跨文化广告传播已成为一种趋势。在实现经济利益与促进文化的交流与传播外,也推行着一种文化霸权主义,对他国的文化造成冲击和伤害。本文通过对跨文化广告传播中文
目的评价新辅助化疗TAC方案治疗妊娠期乳腺癌的临床效果。方法选取2010年1月至2014年12月郑州大学第一附属医院乳腺外科收治的34例妊娠期乳腺癌患者,均以TAC方案新辅助化疗3~
为了探讨我国中小规模影视城的未来发展路径,本文以焦作影视城为研究案例,分析了目前影视城发展中存在的困境以及发展模式的选择。据此从旅游产品、旅游文化、旅游设施、旅游
本文以国家自然科学基金项目“数控机床回转送进精密直接驱动技术及其控制策略研究”为背景,针对直接驱动数控转台用永磁环形力矩电机伺服系统易受外部扰动及自身参数变化影
文化共享时代的独特性主要体现在三方面:全球互联的虚拟在场,使我们观察视野上的广阔性而非狭窄性得到了增强;边缘与中心位置结构关系的不确定性存在;道路或者延长线意义上网
学生消费主义作为一种诞生于高等教育市场化的思想对高等教育发展具有重要功用。它能够引导高等教育从学生的角度出发,遵循市场的规范,思考高等教育该如何发展。这不仅有助于
目的:探讨火针治疗结节囊肿性痤疮的临床效果。方法:根据《中药新药临床指导原则(试行)》的诊断标准选取100例结节囊肿痤疮患者,随机分组,各组为50例,对照组使用维A酸乳膏(迪维霜)(0
在信息化社会的今天,随着人们生活质量不断地提高,人们对无线通信的需要正不断地扩大。然而无线频谱资源并非是无限的,这也导致有限的无线频谱资源与人们日益增长的通信需求
中小企业集群不仅是区域经济社会发展的重要拉动力量,也是有效缓解发展中国家中小企业融资约束的重要途径。论文以企业融资理论和集群融资理论为基础,在大量引证相关统计数据
丙烯是化学工业中至关重要的基础原料之一,其需求量也随着社会经济的飞速发展而日益提高。传统生产丙烯的方法如蒸汽裂解和催化裂化已经无法满足当下对于丙烯的需求。近年来,