问题理解增强的阅读理解方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户：cl0916789

【摘要】

：

机器阅读理解是指基于给定上下文系统自动回答相应的问题[1],该任务不仅是人工智能及自然语言处理领域的一个研究热点,更是一个挑战。机器是否正确、充分地理解问题是研究阅

【作者】

：

李宣影

【出处】

：

山西大学

【发表日期】

：

2020年01期

【关键词】

：

多维度隐式问题问题理解阅读理解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器阅读理解是指基于给定上下文系统自动回答相应的问题^[1],该任务不仅是人工智能及自然语言处理领域的一个研究热点,更是一个挑战。机器是否正确、充分地理解问题是研究阅读理解任务的关键和基础。但是,目前大部分模型只通过注意力机制对问题建模,对问题理解并不充分。本文针对该问题提出了相应的解决策略,主要工作如下:（1）提出一个基于多维度问题理解的阅读理解方法。本文通过问题类型识别、问题重要词识别、添加外部知识等多个维度加强模型对问题的理解。多维度问题理解的解答策略的主要思想是:首先,利用TextCNN神经网络模型以及问题疑问词确定问题类型,并通过句法分析树和人工制定的规则获得问题的重要词;然后,针对问题重要词添加对应的外部知识;最后,将之前所有的信息融入到阅读理解模型中。在DuReader2.0数据集上进行方法检验,融入多维度问题理解的阅读理解模型比基线模型的Rouge-L值和Bleu-4值分别提高了8.2%、7.0%。（2）针对不包含疑问词的隐式问题提出了相应的理解策略。本文处理此类问题的主要思想为:首先,将隐式问题分为一般隐式问题和复杂隐式问题两类;其次,针对一般隐式问题,利用基于规则的方法添加疑问词将其转换为显式问题;针对复杂隐式问题,依据问题答案使用TextRNN模型识别问题中缺失的疑问词并将其转换为显式问题。最后,将隐式问题的理解策略融入到阅读理解模型中。实验结果表明:融入隐式问题处理的阅读理解模型比基线模型的Rouge-L值和Bleu-4值分别提高了3.6%、2.0%,融入隐式问题处理和多维度问题理解方法的阅读理解模型比基线模型的Rouge-L值和Bleu-4值分别提高了9.5%、7.8%。（3）设计并实现了一个针对中文篇章片段抽取式的阅读理解原型系统。本文依据上述研究方法设计并实现了一个针对中文篇章片段抽取式的阅读理解系统。系统主要包括五个模块:预处理、隐式问题处理、问题理解、篇章理解、答案预测,实现的主要功能是:输入问题及篇章,经过对隐式问题判断、问题分类、识别问题重要词、添加外部知识等问题理解处理步骤,然后对篇章和问题建模,最后输出问题答案。本文提出了一个基于多维度问题理解的阅读理解方法以增强模型理解问题的能力,并对隐式问题的理解提出了相应的解决策略,在真实问题的解答上取得了一定的效果。今后,会进一步加强对问题重要词、抽象词的理解,探索对隐式问题理解更充分的方法。

其他文献

省、地广域互联DTS系统分布式建模的研究

以河北省电力调度中心应用的国内第一套实际投入运行的省、地广域联合培训仿真系统为例,介绍了系统的主要组成部分、技术特点及技术创新点.同时说明了DTS系统建模现状,并从电

期刊

电网培训仿真系统分布式建模模型合并模型匹配图形合并DTS distributed modeling model merge model matchin

以职业能力培养为引导的高职英语课程教改研究

社会的发展建立在教育工作上,因为有强大的教育能力,社会才得以稳步快速发展。之所以教育成为社会发展的动力是因为教育是专注于教学的机构,为社会的发展提供动力的源泉。以

期刊

职业能力高职英语教育改革

高校图书馆信息服务中的索引策略

随着信息时代的到来,各行业领域都开始应用信息化技术。在图书馆领域中为了给予读者优质的阅读服务,使其能够充分应用图书馆资源,就需要充分发挥出信息化技术的作用。索引技

期刊

高校图书馆信息服务索引策略

几种常见风力发电机机型的低电压穿越方案

由于风力发电机相对于传统大容量发电机更容易失去稳定运行状态,因此风力发电机并网问题变得非常突出.低电压穿越功能作为风力发电机并网的难点之一,国家能源局对此制定了相

期刊

低电压穿越定速型风机双馈型风机永磁直驱型风机变流器low voltage through constant speed wind turbine do

凡纳滨对虾血蓝蛋白体外抗肿瘤活性的研究

目前研究表明,血蓝蛋白是一种具有多种免疫学活性的多功能蛋白。本研究从体外水平分析了凡纳滨对虾血蓝蛋白的抗肿瘤活性及其作用机制。结果发现,HeLa细胞经10-50ug/ml血蓝蛋

会议

凡纳滨对虾血蓝蛋白抗肿瘤活性凋亡线粒体

分布式供能是中国“十二五”能源战略重点

围绕分布式供能重大命题展开了系统论述,包括:提高能效和保障供应是当前中国能源战略重点;从热电联产到冷热电联供的历史进程;能源生产和供应的集中与分散两种途径的辨析;区

期刊

分布式供能中国十二五能源战略重点DES/CCHP发展方向发展途径技术措施distributed energyfocal point of the t

医疗废物管理是医院感染管理的重要环节

<正>医疗废物是指在医疗、预防、保健、医学科研和教学及其他相关活动中产生的具有直接或间接感染性、毒性及其他危害性的废物。据WHO相关报道,医疗卫生机构产生的废物中,10%

会议

问题理解增强的阅读理解方法研究

其他学术论文