论文部分内容阅读
自动问答系统是信息检索领域的一个重要研究方向,阅读理解系统是其一个重要研究分支。阅读理解系统通过对一篇自然语言文本的分析理解,针对用户根据该文本所提的问题,自动抽取或者生成答案。知识表示与推理作为一种自然语言理解方法,具有将上下文知识形式化并易于自动推理的优点。本文将知识表示与推理应用于阅读理解系统。将逻辑推理应用与阅读理解需要将阅读理解问题转换为合适的逻辑推理问题,用逻辑推理得到的论证对阅读理解的问题进行答案抽取。在文本的知识表示方法上,本文采用文本谓词表示方法。文本谓词表示是一种一阶谓词逻辑表示方法,不同的单词对应不同的逻辑谓词,谓词参数的位置信息表示句法语义信息。为实现文本谓词表示的自动生成,本文在句法分析的结果上建立了逻辑表示转换系统。并在定理证明机Prover9的基础上实现了文本逻辑表示的自动推理系统。首先,本文将阅读理解篇章与问题送入逻辑表示转换系统生成对应的文本逻辑表示,对问题逻辑表示深入处理以保持阅读理解问题的意义;然后将逻辑表示与相关推理知识交给逻辑推理系统,得出推理论证。在逻辑推理的过程中,知识库的作用至关重要。本文采用XWN作为推理知识库,并提出了一些推理规则作为知识库的补充。实验表明,这些补充推理规则提高了逻辑推理的准确率。最后,本文按词袋方法从推理论证中抽取答案句,并用词袋方法为无法得到逻辑推理论证的问题抽取答案。最终在Remedia语料上获得了39.0%的HumSent准确率。本文还尝试用词袋方法返回多个答案,用逻辑推理方法对多个答案进行重排序,这种方法在Remedia语料上获得了40.0%的HumSent准确率。