论文部分内容阅读
为了让用户从海量信息中获取有价值的答案,智能问答一直是研究热点之一。问答领域有许多问题需要研究,文本多标签预测与问答匹配是其中两个比较关键的问题。在进行问答匹配过程之前,首先使用多标签预测技术分别对当前问句与答案进行主题标签预测,然后将与问句主题无关的答案句进行过滤,这种方式能够提升问答匹配阶段所需问答数据的质量,提高返回的答案信息精度,改善使用体验。本文利用深度学习模型开展文本多标签预测,问答匹配这两部分的研究,主要工作内容如下:在文本多标签预测上,本章提出了一种融入标签及文本语义联系的多标签预测方法,其主要在传统深度学习模型(LSTM)解决多标签预测问题时,融入相关标签库以及文本语义对当前预测标签的影响因子,构建了TBLSTM-TSS多标签预测模型。在不需要人工设计复杂的特征工程的情况下,TBLSTM-TSS模型能够加深相关标签及文本中的关键信息与当前预测标签之间的语义联系,避免了在对长序列文本预测标签时,关键信息出现语义减弱或消失问题。最后在关键信息不丢失的基础上,利用TBLSTM-TSS模型本身较强的学习能力,提高多标签预测精度。在问答匹配情况下,本章提出了一种基于Attention的深度问答匹配方法,主要在深度学习模型(GRU,CNN)的基础上,融入问句与候选答案句中短语颗粒度的语义关注学习,构建了ATPH-BGRU-CNN模型。在问答匹配时使用ATPHBGRU-CNN模型能够提升候选答案句中正确答案信息的权重,避免了候选答案句中无关信息对问答匹配时的干扰现象的出现。在ATPH-BGRU-CNN模型需要提取句子中的短语,在处理短语划分这部分任务时,本文在传统方法的基础上提出了基于BGRU-HS的短语序列标注模型,提高了短语序列标注的准确性。在实验部分中,通过与相关研究人员的对比实验分析,证明了本文提出的TBLSTM-TSS多标签预测模型以及ATPH-BGRU-CNN问答匹配模型与已有模型相比有着更高的准确率与召回率。