论文部分内容阅读
随着科技的发展,任务型对话系统作为自然语言处理技术的重要应用之一,获得众多行业的关注。任务型对话系统旨在针对特定的服务需求,在多轮交互中获取用户的信息,最终帮助用户去实现特定的任务。任务型对话系统的实现方法分为管道实现方法和端到端的实现方法。管道实现方法由口语语言理解、对话管理和自然语言生成多个模块配合,各个模块可以采用不同方法来实现,因此方法与模块功能的相关性更强,且相比端到端的方法对数据要求不会过高。在当前工业界,管道方法是任务型对话系统的主流实现方法。目前公开的研究工作应用在对话系统的管道实现中还存在一些问题。一是在口语语言理解模块中,模型对任务相关信息的捕获还有待优化,意图识别和语义槽填充的准确度还存在着一定的提升空间。二是在对话管理模块中,由于对话数据集的缺失,对话模型的建模工作面临冷启动的问题。对于自然语言生成模块,基于神经网络的生成方法依赖数据驱动且结果随机性大,会给对话流程带来不可控的风险。基于规则的生成方法可以简单有效地解决生成问题,且人工定义的规则易于理解和改进,是应用到系统实现中的更优选择。因此,本文主要针对前两个模块的问题进行研究,提出新的模型或方法并进行验证。本文首先对口语语言理解任务的意图识别和语义槽填充联合模型进行研究,提出了融合注意力机制的CIASC-BiLSTM模型,该模型利用自注意力机制在编码和解码过程中捕获更多语义信息,并提出交叉融合机制使得两个任务可以共享上下文信息,实验结果证明模型在意图识别和语义槽填充任务上有优秀的表现。除此之外,本文还提出了基于槽框架和状态机的对话管理方法,在冷启动情况下可以根据业务自定义具有灵活性以及可扩展性的对话模型,最大化利用用户的输入信息,优化对话体验。最后,本文将提出的研究方法应用在管道式任务型对话系统的口语语言理解模块和对话管理模块中,并在名医导航业务上进行系统开发和测试,验证本文的研究成果在任务型对话系统的实现中具有可行性。