基于复合神经网络的开放域问题分类方法研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:bzah123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
限于自然语言的复杂性,传统搜索引擎中基于关键词查询的方法,难以满足用户对确切问题搜索的需求;基于常用问题集的问答系统也无法解决开放域的用户提问。因此面向开放域问答系统的智能搜索成为研究热点,问答系统一般分为三个阶段:意图理解,信息检索得到候选答案,答案排序或挑选答案。作为用户意图理解重要的一部分,问题的正确分类不仅可以减少候选答案的选择空间,而且会在极大程度上影响答案的抽取及生成。由于深度学习方法在自然语言处理中具有无需人工构造特征且善于发现高维数据中的错综复杂的结构等优势,因此本文以深度学习在问题分类任务上的应用作为研究点,设计和实现了基于复合神经网络模型的开放域问题分类方法。主要工作包括:首先,本文调研了深度学习在自然语言处理方面的进展,创新性地设计并实现了复合神经网络用于问题分类。这个深度学习框架的输入有两部分,分别是问题简介以及问题描述的词向量表示,由于问题简介一般篇幅较小且无上下文依赖,本文使用不同粒度的卷积核将其映射到不同的隐藏层之后,再经过池化层得到问题简介的高维特征表示,此外,问题描述一般篇幅较长且具有上下文环境,因此,在使用卷积神经网络提取其局部特征的基础上,通过长短期记忆网络生成问题描述词序序列语义的高维特征表示,最后,连接问题简介及问题描述的高维特征表示,经过分类器将问题分至对应的类别。在Yahoo Answers的数据集上使用该模型进行问题分类,证明了在该任务上,本文构造的模型优于传统的机器学习方法,也比之前已有的神经网络模型有了改进。然后,本文选取文本语义泛化作为对模型的改进,通过研究语义泛化的发展,探究其一般原理以及其在工业上的实现-Probase,扩充现有上下位词库并构造文本语义泛化的替换规则,通过实验验证了其在问题分类任务上的有效性。此外,本文关注该深度学习模型在实际应用中的情况。以Keras为例,描述深度学习模型实现的流程,介绍优化深度学习模型的一些方法,并在公共数据集上测试Keras实现的模型,实验结果显示基于Keras实现的深度学习模型能达到其最佳表现。
其他文献
研究目的:验证USP4与TGFβRI能否发生相互作用;检测USP4对TGFβRI的泛素化修饰;检测TGF-β信号通路活化后EMT标志分子的变化;探讨USP4蛋白表达对乳腺癌细胞生物学活性的影响;
随着网络的迅速发展,给青少年开辟了一条崭新的学习和娱乐之路。但青少年在享受网络这把"双刃剑"带来便利的同时,也不得不面对它产生的负面影响,即"网络成瘾",严重地影响青少
本研究旨在通过对肝硬化患者生活质量及其影响因素的调查分析,为临床心理干预治疗及提高患者生活质量提供依据。
目的 研究不同方法提取的黄芪-莪术提取物的抗肿瘤作用。方法 建立人肝癌细胞株HepG2模型,分别以95%乙醇、50%乙醇、水提醇沉、传统水煎四种方法为提取工艺,用CCK-8法检测不
为最大限度发挥军队院校科研经费效用,使其转化为促进战斗力提升的高质量科研成果,提出以绩效为导向加强科研经费预算管理。通过阐述绩效导向的军校科研经费预算管理模式,分
<正>近年来,妇科炎症用药的零售市场日益扩大。有关调查显示,在用于治疗妇科炎症的药物销量中,零售市场的销量占63%,医院的销量占37%。可见更多患了妇科炎症的女性倾向于自己
季振同、黄中岳是中国革命战争史上著名的宁都起义的重要领导人。1931年12月14日,他们与董振堂、赵博生等一起通电全国,宣布原二十六路军实行革命暴动,加入红军。1932年5月,
学生是研究性学习的主体,课题研究的最终完成还得靠学生自己到实践中去探索.教师的指导作用在于培养和提高学生发现问题、分析问题和解决问题的能力.