论文部分内容阅读
口语对话系统随着人工智能、认知科学、语言学等领域以及硬件条件的发展已越来越受到研究者们的关注,目前自然语言理解的发展也使得把人机对话系统应用到许多方面成为可能。口语对话系统必将改变人机之间的交互方式并最终改变人们的工作、学习和生活。 激励学习(Reinforcement Learning)是具有自学习特点的一个机器学习的重要分支。激励学习把学习看成是一个反复试错的过程,从而把环境状态映射到相应的动作。它能很好地解决智能体在随机状态环境下寻找最优动作的问题。 本文把激励学习用于口语对话系统,对Walker和Singh的口语对话系统模型进行了改进,建立了一种适应面更广的新的口语对话系统模型RL-SDS(Reinforcement Learning-Spoken Dialogue System),该模型被分别用于机房查询系统和大学生心理咨询系统两个口语对话环境中。同时,在机房查询系统的口语对话环境中对RL-SDS模型和Singh提出的模型进行了比较,在Walker和Singh的模型无法处理的大学生心理咨询系统的口语对话环境中,本文对RL-SDS模型也进行了一个激励学习效果的分析。