论文部分内容阅读
聊天机器人是一种根据用户的自然语言输入实时产生自然语言反馈的聊天系统。因其丰富的应用场景和潜在的商业价值,能与人流畅自然对话的聊天机器人一直是人工智能领域关注的焦点。但由于缺乏知识、无法较好地理解事物之间的逻辑关系,聊天机器人普遍存在知识推理能力不足的问题;同时,由于无法像人脑一样高效地回顾和运用历史信息,聊天机器人在对话中容易偏离聊天主题,多轮对话能力较弱。知识图谱是一种用于记录知识和揭示事物之间逻辑关系的图数据结构,运用有效的算法还可以实现较为复杂的逻辑关系推理运算,是提高聊天机器人性能的一条有效途径。本文围绕基于知识图谱的多话轮聊天机器人展开研究,取得的主要成果如下:(1)针对聊天机器人缺乏知识推理能力、容易生成错误答案的缺陷,提出了一个可以有效利用知识图谱的深度学习模型——KE-Seq2Seq。通过注意力计算将与用户输入消息有关的图谱知识融入模型的编码器中(编码器知识融合机制),达到提升模型知识推理能力的目的。结果表明,模型的流畅度、准确率、召回率、F1值4项主要指标均得到显著提升。(2)针对聊天机器人多轮对话能力不强、容易偏离主题的不足,提出了一个可以有效利用历史图谱信息的深度学习模型——KD-Seq2Seq。通过双重注意力计算将与历史对话相关的图谱知识融入模型的解码器中(解码器知识融合机制),有效增强了跟用户交互的多轮对话能力。结果表明,模型的流畅度、准确率、召回率、F1值和合理性等主要指标均得到显著提升。(3)同时使用编码器和解码器知识融合机制,提出了知识推理和多轮对话能力的联合增强模型——KED-Seq2Seq,较前述单一增强模型性能更优;基于该联合增强模型开发了聊天机器人Web服务,实现了一个消息闭环、流程完整、交互友善、高效可用的聊天机器人系统。