【摘 要】
:
随着深度学习的复兴,再一次掀起了人工智能的研究高潮,而对自然语言处理来说,自然语言一直以来被誉为是人工智能领域的皇冠。其中,推理能力是实现真正人工智能的一个关键因素,为了让机器获得更强的推理能力,有学者提出利用机器阅读理解任务来让机器获得深度推理能力,并且随着阅读理解相关的各类型数据集发布和模型快速发展,促使机器阅读理解迅速成为nlp领域最热门的研究方向之一。百度于2018年提出DuReader2
论文部分内容阅读
随着深度学习的复兴,再一次掀起了人工智能的研究高潮,而对自然语言处理来说,自然语言一直以来被誉为是人工智能领域的皇冠。其中,推理能力是实现真正人工智能的一个关键因素,为了让机器获得更强的推理能力,有学者提出利用机器阅读理解任务来让机器获得深度推理能力,并且随着阅读理解相关的各类型数据集发布和模型快速发展,促使机器阅读理解迅速成为nlp领域最热门的研究方向之一。百度于2018年提出DuReader2.0数据集,相较于其他阅读理解任务数据集,DuReader2.0有着很大的不同,它的数据来源丰富,问题类型复杂,文本数据很长,并且每个问题对应多个文章和多个人工答案。针对DuReader2.0这种多文档多答案的机器阅读理解任务,本文主要从三个方面来进行研究,考察长文本的有效信息提取,研究文章与问题信息的有效融合,并研究如何获取更丰富的文本信息。本文的主要工作内容和成果如下:(1)研究并复现了在单文档问题跨度抽取任务上具有较好性能的BiDAF模型(百度官方给出的基准模型),并以BiDAF的成绩作为本文任务的基准成绩,以BiDAF模型作为我们工作改进的基准模型。(2)针对DuReader2.0这类多文档多答案的机器阅读理解任务,本文首先引入一种新的段落提取策略,将可能包含答案片段的文本提取出来。首先计算问题和文档各个段落的BLEU-4的分数,根据分数依次排序,选取分数最高的四个段落,以及后续段落中第一个句子,将它们拼接起来,截取不超过最大模型输入范围的片段作为我们模型的输入文本。针对多参考答案,我们在文章中提取与人工答案F1值最高的片段作为我们训练的预测答案。(3)同时,我们提出了一个新的模型,该模型共有六层,一是段落提取层,计算方法如上。二是词嵌入层,使用在DuReader2.0语料库上预训练的GloVe词向量作为模型的词嵌入。三是编码层,使用BiLSTM来对文章和问题进行编码,以获取文章和问题的初步表示。四是交互层,使用双向注意力来融合文章和问题的信息,其通过计算相似度矩阵,利用softmax获得注意力权重,以获得问题感知的文章表示和文章感知的问题表示,再加上一层self-attention进一步融合文章和问题的信息。五是卷积层,使用卷积+highway+反卷积层的方式来获取更丰富的文章信息。六是输出层,利用softmax函数获取预测答案的开始位置和结束位置。在训练的处理上,作者引入了一个针对多答案的损失函数,即对最大似然损失函数进行求和取平均,以提高模型的性能。本文的实验基于DuReader2.0数据集,在开发集给出实验消融分析和与基准模型对比结果。实验表明,本文提出的模型相比于百度官方给出的基准模型BiDAF在ROUGE-L和BELU-4得分上有着一定的效果提升。
其他文献
近年来,基于电调光变色材料的器件——电调光变色器件,因其巨大的应用价值而受到人们的广泛关注,部分相关器件,如智能窗,防炫后视镜等,甚至已投入生产和应用。自1953年电调光
2015年“提升科学研究水平”已经被国务院列为推进高水平大学建设的10项重点任务之一,突出强调高校科学研究要以国家重大需求为导向,以解决重大问题为目标,着力提升高校科学研究水平,优化科研创新模式。绝大部分高校把科学研究水平当作衡量高校综合质量的关键因素之一。高校图书馆科研支持服务是高校科研水平的重要保障之一,为高校科研人员提供优质的学术资源和科研支持服务是高校图书馆重要的职责,研究高校科研人员需求
近年来,目标跟踪已经成为计算机视觉领域的热门课题之一,可广泛应用于无人机、视频监控、人机交互等许多实际系统中。目标跟踪算法的任务是利用给定的初始帧来预测后续帧的目
氧化物半导体材料可以作为薄膜晶体管(TFTs)的有源层,在新兴的柔性或透明电子电路中具有广阔的应用前景。与传统的非晶硅相比,氧化物半导体具有多种优势,如可低温甚至室温制
在数学测试以后,教师向学生进行评讲试卷是一个不能缺少的环节,是数学总体教学的一个重要流程,是师生进行查缺补漏的重要手段;是教师检查教学质量、学生加深认识、解答疑惑、
在清末民初的大变局中,著名书法家、教育家李瑞清经历了废科举、兴学堂的时代,见证了该时期书法教育的起伏变迁。1905年,李瑞清在两江师范学堂担任监督(校长),首开图画手工科
2019年3月18日,习总书记在北京主持召开学校思想政治理论课教师座谈会上强调改革创新思政课要坚持理论性和实践性相统一,在社会大课堂中学习和践行科学理论。近年来,将思想政
自上个世纪九十年代以来,AlGaN/GaN HEMT凭借着其优异的特性发展迅猛,与传统的Si器件相比,GaN HEMT可以工作在更高的频率和温度下,并且具有更高的击穿电压和低的导通损耗,然而常规的AlGaN/GaN HEMT一般为耗尽型器件,应用这种耗尽型器件时,需要额外的负栅压才能使器件关断,毫无疑问这会大大增加系统的功率损耗,在零偏时,器件中仍然会有电流通过,对电路的可靠性和安全问题有很大的影
公平竞争审查以行政机关自我审查的方式对行政垄断进行事前规制,有利于规范政府行为。公平竞争审查的核心是政策措施制定机关在政策制定过程中对照审查标准进行自我审查,预防
为了使系统在组件故障,局部通信失效,能量匮乏等情况下依然可持续满足控制需求,一些系统,如安全关键系统需要在系统运行的过程中进行重构。这些系统可以被视为动态可重构系统(dynamic reconfigurable system,DRS)。一个DRS包含多个构型并通常运行在某特定构型下。在接到重构命令后,系统需要从当前构型重构至另一个构型。由于不受控的DRS重构行为会使系统不稳定并违反控制需求,重构行