论文部分内容阅读
人工智能的迅速发展使得问答系统得到进一步的发展,而基于人工智能的问答系统的应用也是随处可见。大规模的数据出现,随之而来地是用于存储的知识图谱。而知识图谱的出现给了问答系统新的可能性,基于检索式的问答成为了知识图谱问答的主流应用。而本文的研究重点在于将知识图谱应用于多轮的交互,实现多轮问答。目前,基于知识图谱的单论检索式问答已经相对成熟,但是对于多轮的问答探索较少。因为在用户在获取信息的过程中,并不能一次性的给出所有关键词,因此,为了提供给用户更友好的帮助,给以用户友好的引导,从而精确定位用户需求,返回用户真实所需。因此,进行多轮的问答具有必要性。整个系统包括了图谱构建环节、多轮问答模型设计以及系统实现环节。首先,本文通过多源异构的数据进行实体抽取,其中,通过爬虫获取的网页数据通过正则抽取,而自由文本则通过知识样本树进行抽取。然后,将抽取实体转为三元组,存入基于Docker-compose动态构建而成的Neo4j图数据库中。接着,通过构建进行人机交互的历史记录存储以及传输功能,实现历史通信内容的记录,借此进行本轮对话的分析以及基于槽模型或者随机游走模型的回复生成。最终,将图谱构建以及多轮问答实现模式化,形成一个通用的程序,实现配置式的机器人的构建,并将其进行网页化的展示。本文所提出的多轮问答系统给出了一个完整的实现方案,但仍有需要优化的地方。其中,图谱构建环节对于同义词、近义词的实体对齐可将其加入优化构建,而多轮问答也需要将向量化加入,从而更好的实现相似问题识别的功能。