【摘 要】
:
随着人工智能的发展和普及,智能问答系统的出现得到人们的广泛使用,它能够快速简洁、准确的返回人们用自然语言所提出问题的答案,但大量的信息增长使得人们对问答系统快速响应的需求不断增高,因此,提高问答系统的响应时间成为了该领域的主要研究目标。问答系统问句的分析直接影响了问答系统的应答性能。本文主要研究问句分析中的问句意图识别任务,旨在判断问句文本的意图类别,基于机器学习的方法是目前主流的方法之一,但在大
论文部分内容阅读
随着人工智能的发展和普及,智能问答系统的出现得到人们的广泛使用,它能够快速简洁、准确的返回人们用自然语言所提出问题的答案,但大量的信息增长使得人们对问答系统快速响应的需求不断增高,因此,提高问答系统的响应时间成为了该领域的主要研究目标。问答系统问句的分析直接影响了问答系统的应答性能。本文主要研究问句分析中的问句意图识别任务,旨在判断问句文本的意图类别,基于机器学习的方法是目前主流的方法之一,但在大量的标注的中文语料来训练分类模型时,还存在分类性能低下且耗时过长的问题,因此,在提高分类准确率的同时,缩短分类时间极具研究价值。并且,粗粒度的意图分类任务在文本分类中类别区分能力较缺乏。针对上述问题,本文主要研究工作如下:(1)针对目前大量标注的文本语料使用机器学习分类时准确率低下且耗时过长的问题,本文在基于深度学习的意图分类基础上,引入自注意力机制,结合基于门控循环单元的自注意力机制,提出基于门控自注意力的用户意图识别方法(Recurrent Neural Network and Attention inner GRU based on query,RAGRU)。通过门控自注意力机制应用于特征学习之前以关注句子前部到后部的全局特征,增强句子特征提取准确度,提高分类模型性能的目的。(2)针对粗粒度意图分类任务类别区分能力较缺乏以及提取特征引入较多无效字符而影响文本原始信息的问题,本文在RAGRU方法的基础上,引入CD_SFT模型(Word2vec and Specific TF-IDF),提出基于CD_SFT文本表示模型的问句意图识别方法(RAGRU based CD_SFT,RAGRUT)。其中CD_SFT方法融合了Wor2vec和改进的TF-IDF。通过CD_SFT模型获得增强后更具类别区分能力的文本信息,使用RAGRU方法来对增强的文本信息进行深度学习,从而获得更好的分类效果。(3)本文在垂直领域保险问句数据集上进行实验来验证RAGRU和RAGRUT方法的有效性,将RAGRU方法与其它常用基于深度学习的意图识别方法进行比较,实验表明RAGRU方法在保证分类准确率的情况下,分类时间也得到较大提升,准确率比最好的对比方法还要高1.14%,时间只有对比方法中最快的0.89%。将CD_SFT方法与Word2vec模型相比,准确率最高提高了1.68%,并使RAGRUT达到对比方法中的最高准确率。
其他文献
不同性别的动物在生理和生物学功能上存在很大差异,而肠道是消化吸收饲料营养的主要场所。为了研究不同性别农华麻鸭肠道发育及微生物是否存在差异,在相同条件下对农华麻鸭公鸭和母鸭进行饲养,分别在第2、5和10周时测定其十二指肠、空肠、回肠和盲肠的相对长度(RL)、相对重量(RW)和密度(ID),利用HE染色观测各肠段的形态结构,并通过16s r RNA分析肠道内容物中的微生物。结果表明:(1)农华麻鸭肠道
手机盖板作为手机的重要组成部分,盖板上的缺陷会严重影响手机的使用价值。针对目前手机盖板产量大、传统的人工检测无法满足市场需求的大背景,利用机器视觉代替传统的人工目测也是该产业发展的趋势。因此,本课题对一些常见的表面缺陷类型和现有的检测理论进行了讨论,设计了手机盖板表面缺陷检测系统的总体方案;对比分析了不同预处理方法的实验效果,对手机盖板表面缺陷检测算法进行了深入的研究和设计,并完成了相关验证实验。
仔猪断奶可能会增加感染革兰氏阴性病原体的风险,革兰氏阴性病原体可以产生许多毒力因子,包括内毒素脂多糖,但是在畜牧业中禁止使用抗生素。碱性磷酸酶(AKP)是一种非特异性的磷酸单酯酶,它可影响哺乳动物肠道健康,包括预防和减少肠道炎症和细菌易位、解毒局部和全身的肠道内毒素从而起到抗炎作用等功能,可将AKP制成添加酶制剂作为绿色饲料添加剂。本论文通过诱导筛选发现源于大肠杆菌Pho A酶活增加约2.5倍;通
家蝇(Musca domestica)和黑腹果蝇(Drosophila melanogaster)同属于双翅目蝇科,在将近一亿年的分支进化中,它们外化的感觉器官--刚毛,在保留了原始祖先共有的特征的同时,又进化出各自独特的表型,是研究表型性状进化的优秀遗传标记。家蝇和黑腹果蝇在背板中部(Drosocentral,DC)粗刚毛的发育存在差异,家蝇具有6对DC刚毛,黑腹果蝇具有2对DC刚毛,但它们在背
随着化石资源的日益消耗,人们越来越重视利用可再生资源来代替传统的化石资源。木质纤维素是地球上最丰富的可再生资源,可以水解转化成高附加值化学品和液体燃料等,因而逐渐受到人们的重视。同时,以生物质-木质纤维素为原料制备炭基固体酸来催化水解转化反应过程,可实现可再生资源的多重利用。然而,这类炭基固体酸是由聚合芳香烃通过其边缘极性功能团强的氢键堆叠形成的致密层状非孔结构,在催化纤维素水解转化过程中还存在着
行人是道路交通中的易受伤害群体,对于智能车来说,快速准确的检测出道路上的行人具有重要意义。经过多年的发展,基于深度学习行人检测算法已经能很好地检测出道路上的行人,但仍然存在很多问题需要解决,例如对远距离行人和被遮挡行人检测效果差、算法的速度慢以及参数量过多等。本文以低参数量目标检测算法YOLOv3-tiny为基础对行人检测算法进行进一步研究。对YOLOv3-tiny的漏检率高以及对远距离行人和部分
胶质瘤是起源于神经胶质细胞的肿瘤,是常见的原发性颅内肿瘤,占所有恶性脑肿瘤的80%,具有极高的复发率和死亡率,对人类危害极大。临床上对于胶质瘤的标准治疗方案以手术切除为主,术后结合放射治疗(radiation therapy,RT)以及联合替莫唑胺(temozolomide,TMZ)化疗。目前,临床上应用于胶质瘤的化疗药物因耐药性的存在而疗效不佳,故而亟待探索和开发新的用于胶质瘤治疗的方法和药物。
结构优化向来是科学研究和工程应用的主要问题。然而,随着研究与应用的深入,优化问题变得日益复杂,许多问题包含离散变量和多个优化目标,且需考虑各种工程约束,传统的结构优化设计方法难以胜任,因此人们转而使用自主学习、通用性强的智能算法解决此类问题。差分进化算法(Differential Evolution,DE)是一种通用且高效的启发式智能算法,其直接搜索和高度并行的本质使其具有处理离散变量多目标优化问
研究背景:ZCCHC10(zinc finger CCHC-containing 10)基因位于染色体5q31.1上。有研究报道ZCCHC10在肺癌和急性髓系白血病(acute myeloid leukemia,AML)中发生缺失或甲基化,暗示该基因与肺癌和AML相关。本实验室已证实ZCCHC10蛋白通过抑制MDM2(murine double minute 2)介导的p53泛素化,维持p53蛋白
骨骼和肌肉均起源于中胚层,它们在解剖位置上彼此相邻,更有利于二者通过力学信号和化学信息方面进行交流。一方面,骨骼为肌肉提供附着面,进而影响骨骼的结构。另一方面,它们可以通过传递化学信息来相互影响,但作用机制还不清楚。前期研究发现,肉鸭胸骨钙化过程与胸肉发育存在协同性,我们认为:骨骼钙化过程中的分泌蛋白,可能通过旁分泌途径调控了肌肉的发育过程。为研究骨骼分泌蛋白对肌肉发育的影响,本研究拟以农华麻羽肉