基于深度学习的文本多标签预测及问答匹配方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:chinasun09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了让用户从海量信息中获取有价值的答案,智能问答一直是研究热点之一。问答领域有许多问题需要研究,文本多标签预测与问答匹配是其中两个比较关键的问题。在进行问答匹配过程之前,首先使用多标签预测技术分别对当前问句与答案进行主题标签预测,然后将与问句主题无关的答案句进行过滤,这种方式能够提升问答匹配阶段所需问答数据的质量,提高返回的答案信息精度,改善使用体验。本文利用深度学习模型开展文本多标签预测,问答匹配这两部分的研究,主要工作内容如下:在文本多标签预测上,本章提出了一种融入标签及文本语义联系的多标签预测方法,其主要在传统深度学习模型(LSTM)解决多标签预测问题时,融入相关标签库以及文本语义对当前预测标签的影响因子,构建了TBLSTM-TSS多标签预测模型。在不需要人工设计复杂的特征工程的情况下,TBLSTM-TSS模型能够加深相关标签及文本中的关键信息与当前预测标签之间的语义联系,避免了在对长序列文本预测标签时,关键信息出现语义减弱或消失问题。最后在关键信息不丢失的基础上,利用TBLSTM-TSS模型本身较强的学习能力,提高多标签预测精度。在问答匹配情况下,本章提出了一种基于Attention的深度问答匹配方法,主要在深度学习模型(GRU,CNN)的基础上,融入问句与候选答案句中短语颗粒度的语义关注学习,构建了ATPH-BGRU-CNN模型。在问答匹配时使用ATPHBGRU-CNN模型能够提升候选答案句中正确答案信息的权重,避免了候选答案句中无关信息对问答匹配时的干扰现象的出现。在ATPH-BGRU-CNN模型需要提取句子中的短语,在处理短语划分这部分任务时,本文在传统方法的基础上提出了基于BGRU-HS的短语序列标注模型,提高了短语序列标注的准确性。在实验部分中,通过与相关研究人员的对比实验分析,证明了本文提出的TBLSTM-TSS多标签预测模型以及ATPH-BGRU-CNN问答匹配模型与已有模型相比有着更高的准确率与召回率。
其他文献
研究背景:原发性免疫球蛋白A肾病(Primary Immunolobin A nephropthy,IgAN)简称IgA肾病,典型特征为肾小球系膜区免疫复合物IgA沉积,并伴有肾小球系膜区细胞增生和系膜基质扩
OGFC超薄磨耗层是一种排水式磨耗层,因具有优良的排水、抗滑、降噪等性能,日益受到关注。但由于空隙率大、沥青用量少,易出现松散、剥落等问题,必须选用性能优良的高粘度改性
如今,全站式陀螺仪被广泛应用于贯通等精密工程,但是我国在全站式陀螺仪的研究与制造方面水平远落后于国外。以此为背景,论文结合国内外的研究现状,利用测绘学院的索佳全站式
本文研究了已知的Bent序列集的构造方法.利用有限域的理论确定了任一Bent序列集相关值的分布情况.同时,构造出了一类新的Bent序列集,给出了这类Bent序列的线性复杂度的精确值
本文研究了广义特殊Tzitzeica-Dodd-Bullough类型方程,利用动力系统分支理论方法,证明该方程存在周期行波解,无界行波解和破切波解,并求出了一些用参数表示的显示精确行波解。
目的:以补阳还五汤中羟基红花黄色素A的含量为考察指标,建立补阳还五汤中红花药材的煎煮动力学模型。方法:建立HPLC法测定补阳还五汤中羟基红花黄色素A含量;以Fick扩散定律为