论文部分内容阅读
机器阅读理解是测评机器对自然语言文本理解能力的重要任务,是人工智能水平的一个重要标志。选择题型机器阅读理解是给出文章和问题,让机器从多个答案候选项中选择出正确答案。这些答案候选项通常不是给定文章中的文本片段,而是根据文章内容改写的表述、总结归纳,甚至需要对文章或借助外部常识知识进行推理获得的信息,因此该任务有较高的语义理解要求。本文从语义匹配、语义推理和外部知识辅助三个方面研究选择题型的机器阅读理解任务。本文采用一个鲁棒性强的Co-Matching模型作为基础模型,该模型在交互层中将问题和候选项分别与文章进行同时匹配。但该模型有两个不足,一是语义匹配方式不够全面,未考虑到问题和候选项之间往往存在信息互补,二是缺乏语义推理。因此,本文第一个工作增加了问题与候选项的互补信息,并将其与文章进行语义匹配,实验结果表明此改进有助于提高模型的语义匹配能力。通常选择题型任务的答案不是原文片段,模型往往需要深入理解文本含义,进行语义推理。因此,针对Co-Matching模型的第二个不足,本文第二个工作是在第一个工作进行语义匹配的基础上提出并增加两种多步推理方法。为了使每一步推理不仅只依赖前一步的结果,而且能使用更早的结果进行当前推理,本文在多步推理过程中加入残差连接。实验结果表明多步推理和残差连接均有助于提高模型的准确性。前两个工作都假设答案只来自于文章,因此在回答需外部知识辅助的问题时,模型性能受限。本文第三个工作增加了外部知识辅助功能,通过句子级外部知识融入方式,利用外部知识、问题、文章和候选项四者的信息共同进行语义匹配和语义推理。实验结果表明融入句子级外部知识辅助语义匹配和推理有助于提高需外部知识辅助问题的准确率。通过深入分析选择题型机器阅读理解任务的特点,本文从语义匹配、语义推理和外部知识辅助这三个方面有效地提高了选择题型机器阅读理解模型的整体性能。