面向高校迎新的机器人问答系统研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:addegoflywzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高校迎新工作中,因涉及到的相关部门和程序较多,所以在相应入学事务的解释上极难做到统一。如何为新生提供一致的、实时的、交互性强的入学服务,使新生入学事务的办理效率提高,是该场景中亟待解决的问题。本论文以高校迎新为应用场景,构建的机器人问答系统实现了部分替代人工解答新生问题的目标,给新生提供了一种更智能化的答疑解惑新途径。这不仅能提升高校新生入学服务的质量和效率,而且对政府机关的办事大厅、交通旅游集散地等的类似需求及相关问题也具有积极意义。通常,机器人问答系统融合了自然语言处理技术和信息检索技术,根据问答内容的开放程度,可以将其分为开放领域型和封闭领域型两大类。本文研究了封闭领域型的机器人问答系统,并重点改进了相关智能算法。本文构建的高校迎新机器人问答系统,主要包含问答库构建、问题理解、问题检索、答案抽取四大模块,涉及的关键技术包括文本预处理、词向量、卷积神经网络、长短期记忆网络以及Flask。其中问题理解和问题检索是核心,主要指完成对问句的语义理解,进一步抽象为如何有效地提高原始问题文档的分类准确度、如何有效地提高新生问句与问答库中问句的匹配率,这是本文的研究重点。因此,作者本人的主要工作是改进并实现了基于双通道卷积神经网络的问题分类模型和特征融合的问句相似度计算模型,同时完成了重庆理工大学迎新机器人问答系统的构建。基于双通道卷积神经网络的问题分类模型,主要使用了词向量技术和卷积神经网络技术。其中,词向量模型是由Google提出的Skip-Gram模型和CBOW模型,卷积神经网络的优化目标为提高分类准确率。本文提出一种结合词性贡献度和词向量模型应用场景的双通道卷积神经网络模型,通过引入词性概率和词向量权重两个因子,改善传统方法中短文本表示特征稀疏及不精确的问题,同时选取双通道的输入模式以丰富网络输入信息,协同达到分类的最优效果。特征融合的问句相似度计算模型运用卷积神经网络和双向长短期记忆网络分别提取文本的局部特征和全局特征,再将两种特征融合完成问句间的相似度计算。该模型将不同粒度的特征互补融合,解决了卷积神经网络不考虑词在上下文中关系的问题,也避免了传统循环神经网络梯度消失或梯度爆炸的问题,提高了相似度计算的准确率。实验表明,本文所述的机器人问答系统检索答案的准确率相比于传统问答系统提高了11%,验证了本文改进算法的可行性。
其他文献
2013年4月4日施行《关于办理盗窃刑事案件适用法律若干问题的解释》的第3条对于特殊盗窃类型进行了解释。结合立法目的和盗窃罪特点,其中"多次盗窃"的规定符合我国目前的立法
目的探讨护理人员结核病知识培训的开展及价值。方法选择该院2018年6月—2019年6月60名护理人员作为该次研究入组对象,进行结核病知识培训,培训前后对护理人员进行问卷调查,
研究零售商主导的闭环供应链奖惩机制问题,分别建立了四个博弈模型:政府对制造商实施奖惩机制;政府对回收商实施奖惩机制;政府同时对制造商和零售商实施奖惩机制以及同时对制
根据近年来常态混凝土、碾压混凝土、胶凝砂砾石、堆石混凝土等不同种类混凝土筑坝技术特点。借鉴混凝土面板堆石坝设计理念和碾压混凝土快速筑坝技术优势,在混凝土筑坝新技术
在中国的资本市场发展格局中,一个特有的现象就是唯股独大,畸重发展,作为资本市场的重要组成部分的企业债券市场则没有引起足够重视。在分析企业债券市场滞后发展的问题时,人们往
康德认为从形式上我们可以把构成知识的判断划分为分析判断与综合判断两大类。关于两类判断的划分问题在康德的认识论哲学思想中占有十分重要的地位。而当联系一些近代哲学家
熵是热学中的一个重要物理概念,也是近年来人们特别感兴趣的一个概念,它已经远远超出物理学的范畴,在自然和社会科学的许多领域中得到广泛应用。本文从教材内容、教学过程与
本研究的目的是以旅行背包为基础,分析背负系统的设计要素,提出户外便携式设备背负系统的设计关键,为其设计提供设计参考。以户外便携式设备背负系统为研究对象,从"五带三装
新卡通一代和最近新出炉的“果冻”正遭受着更严厉的批评。今年6月份,重庆市501艺术基地举办了“新批评、新艺术——新一代批评家论坛”。参与论坛的青年批评家中,鲍栋和杜曦