深度循环神经网络在特定场景自动问答中的应用研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:bfxj8812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用深度学习解决自然语言处理任务已成为当下主流。深度学习的本质是利用计算机构建神经网络,去模拟一个通用的、具有良好泛化性能的黑盒函数达到识别与预测的目的。研究表明,深度循环神经网络所构建的系统在针对时序特性的数据处理上具有良好的表现,例如基于循环神经网络的序列到序列(sequence to sequence,seq2seq)技术在开放场景自动问答的应用。然而,seq2seq技术不足以应对特定场景下较为专业的用户需求。首先,经典的循环神经网络单元在输入与输出的层级连接中忽略了某些状态变化从而丢失了一些信息,导致对文本的解析不全面。其次,在特定场景下,利用seq2seq生成的回答中有很多是无意义的回答。针对上述问题,本文以构建一个在特定场景下能充分理解用户提问、生成有意义回答的自动问答模型为研究目标,将该目标分为递进的两个子任务,分别是文本标注和基于文本标注的自动问答模型,并给出相应的解决方案。本文的主要研究工作如下:(1)网状长短时记忆单元结构研究。针对经典深度循环神经网络单元结构的不足,提出一种改进的循环神经网络单元结构。常用的循环网络单元结构如长短时记忆单元(Long Short-Term Memory,LSTM)、门循环单元等结构中,虽然考虑到了文本时序的状态变化,却忽略了深度循环网络输出层和输入层的级联的状态变化,因此本文引入多维度网状长短时记忆单元(Grid Long Short-Term Memory,GLSTM)来解决这个问题。在此基础上,本文提出在GLSTM中加入peephole连接,探究该方法是否能提升GLSTM在文本标注和自动问答的性能。(2)基于循环神经网络的文本标注方法的应用研究。针对文本标注,将深度循环神经网络应用于文本标注任务,并尝试对基于不同类型的循环神经网络单元的文本标注模型进行对比实验,探究基于何种循环神经网络单元的文本标注模型具有最佳表现。(3)基于文本标注的半生成半检索式自动问答模型研究。针对自动问答,在seq2seq技术基础上探索并提出一种新的自动问答模型。结合生成式模型和检索式模型的优点,提出一种基于标注信息和占位符的半生成半检索的自动问答方法。其核心思想是:首先将标注信息匹配知识库问答对的占位符,然后利用文本相似度计算得到与知识库中提问最接近的句子,将得到的最接近的句子和用户的提问分别输入到编码器中进行计算,获取两个句子的匹配度,以此来判断使用生成式模型还是检索式模型产生答案。(4)将超市导购服务作为特定场景,设计并实现一个超市导购服务问答系统以验证理论的可行性。
其他文献
为了有效实现环境保护,加大绿化面积,需要不断完善植物种类、管理模式的优化。本文对园林绿化种植、养护管理进行了分析,针对种植类型提出对应管理优化方案,旨在为绿化工程提
以新浪网和《中国图书馆分类法》为例,阐述了网络信息分类法和传统文献分类法的区别,分析了网络信息分类法中存在的问题,对网络信息分类法的进一步完善及其发展趋势进行了探
目的:PET/CT在非小细胞肺癌(NSCLC)纵隔淋巴结分期方面明显优于单独的CT。我们研究了应用PET/CT进行非小细胞肺癌纵隔转移淋巴结分期对于肺癌放疗计划的潜在影响。通过本实验研
李承新,医学博士、教授、主任医师、博士研究生导师,现任中国人民解放军总医院第一医学中心皮肤科主任。兼任中国整形美容协会医疗美容继续教育分会会长、中国中西医结合学会
2015年高考全国Ⅱ卷理科第20题是一个关于椭圆的定值问题.本文通过对该题第一问的解答,抽象出一个椭圆的一般命题,并将其推广到双曲线中去. In 2015, the National Question
氯甲喹啉酸(Quinmerac)是一种人工合成的生长素型除草剂,多用于控制双子叶杂草。由于Quinmerac使用量大且应用广泛,现在已成为一个重要的污染因素。因此,有必要了解其对植物生
通过对沈阳地区内辽代建筑文化系统性、综合性的研究分析,尝试对其复兴体系发展战略的构建,充分挖掘辽代建筑文化遗址在东北沈阳地区的特质,对沈阳及周边现有辽代建筑文化遗
本文通过对白菜播种前准备、种植技术、肥水管理,病虫害防治等方面的阐述,对白菜的种植技术进行了全方位的解读,以期为相关技术人员提供技术参考,为提高白菜种植效益奠定技术
正弦定理与余弦定理在三角函数这一章节扮演着很重要的角色,这两个定理的正确使用能使得三角函数的有关题目迎刃而解,恰到好处,但是,在使用过程中如果不推敲细节,不挖掘隐含
目的调查分析我国临床医学MOOC课程的应用现状和存在问题。方法通过自制临床医学类MOOC课程状况调查表,选取国内开设临床医学类MOOC课程的7个平台及其所开设的临床医学类MOOC