论文部分内容阅读
传统的基于知识的自动问答(KB-QA)系统面临两个挑战:其一在于将自然语言的句子解析成他们对应的语义表示(Meaning Representation);其二在于如何使用生成的语义表示在知识库中检索答案。以往的研究方法往往将这两个过程像流水线一样地进行处理,即先完成将自然语言句子解析成语义表示,然后再用生成的语义表示检索答案。不同于以往这种顺序处理的做法,本文提出的类翻译的基于知识的自动问答方法将解决这两个问题并入一个统一的框架之下,使这两步交替进行。我们基于Cocke-Younger-Kasami(CYK)解码算法将问句“翻译”成答案。每个CYK单元对应问句的一个区间,该CYK单元所对应的问句区间作为一个完整的、具有意义的子问句可以产生答案。而这些子问句产生的答案作为相应问句区间的“翻译”结果,是由本文提出的“问句翻译”(Question Translation)方法所给出的。“问句翻译”模块首先分别通过基于问句模板和基于关系表达式两种方式将问句区间转化成形式化的三元组查询语句,然后这些三元组查询语句作为相应问句区间的语义表示,被用来从给定的知识库(Knowledge Base)中检索答案。本文使用线性模型(Linear Model)建模。线性模型被定义在派生(Derivation)之上,即每一个样本是一个派生。同时本文使用最小错误率训练(MERT)方法,利用一组问答对来调整模型的特征权重来进行优化。与使用最先进的语义解析方法的基于知识的问答系统相比,本文的方法得到了较好的实验结果。