论文部分内容阅读
利用深度学习解决自然语言处理任务已成为当下主流。深度学习的本质是利用计算机构建神经网络,去模拟一个通用的、具有良好泛化性能的黑盒函数达到识别与预测的目的。研究表明,深度循环神经网络所构建的系统在针对时序特性的数据处理上具有良好的表现,例如基于循环神经网络的序列到序列(sequence to sequence,seq2seq)技术在开放场景自动问答的应用。然而,seq2seq技术不足以应对特定场景下较为专业的用户需求。首先,经典的循环神经网络单元在输入与输出的层级连接中忽略了某些状态变化从而丢失了一些信息,导致对文本的解析不全面。其次,在特定场景下,利用seq2seq生成的回答中有很多是无意义的回答。针对上述问题,本文以构建一个在特定场景下能充分理解用户提问、生成有意义回答的自动问答模型为研究目标,将该目标分为递进的两个子任务,分别是文本标注和基于文本标注的自动问答模型,并给出相应的解决方案。本文的主要研究工作如下:(1)网状长短时记忆单元结构研究。针对经典深度循环神经网络单元结构的不足,提出一种改进的循环神经网络单元结构。常用的循环网络单元结构如长短时记忆单元(Long Short-Term Memory,LSTM)、门循环单元等结构中,虽然考虑到了文本时序的状态变化,却忽略了深度循环网络输出层和输入层的级联的状态变化,因此本文引入多维度网状长短时记忆单元(Grid Long Short-Term Memory,GLSTM)来解决这个问题。在此基础上,本文提出在GLSTM中加入peephole连接,探究该方法是否能提升GLSTM在文本标注和自动问答的性能。(2)基于循环神经网络的文本标注方法的应用研究。针对文本标注,将深度循环神经网络应用于文本标注任务,并尝试对基于不同类型的循环神经网络单元的文本标注模型进行对比实验,探究基于何种循环神经网络单元的文本标注模型具有最佳表现。(3)基于文本标注的半生成半检索式自动问答模型研究。针对自动问答,在seq2seq技术基础上探索并提出一种新的自动问答模型。结合生成式模型和检索式模型的优点,提出一种基于标注信息和占位符的半生成半检索的自动问答方法。其核心思想是:首先将标注信息匹配知识库问答对的占位符,然后利用文本相似度计算得到与知识库中提问最接近的句子,将得到的最接近的句子和用户的提问分别输入到编码器中进行计算,获取两个句子的匹配度,以此来判断使用生成式模型还是检索式模型产生答案。(4)将超市导购服务作为特定场景,设计并实现一个超市导购服务问答系统以验证理论的可行性。