论文部分内容阅读
目前,在高校招生咨询工作中,随着咨询人数的增多以及各部门业务处理流程的各尽不同,在一定程度上造成工作量繁重、管理压力剧增。那么,如何为广大学生及时提供专业性、可靠性、实时性的帮助,这是招生场景中亟需解决的问题。因此,本文以高校招生为应用场景,构建一款初具智能化的招生问答服务系统,该系统将辅助工作人员为学生答疑解惑,这不仅能提高工作效率与满意度,而且对于医疗咨询、银行业务等类似需求场景同样具有积极的借鉴意义。本文的研究目标是构建一款面向高校招生限定领域的智能问答系统,该系统由问句理解模块、问句检索模块和答案生成模块组成,涉及的关键研究内容包含文本预处理、文本向量化、文本分类计算、文本相似度计算、文本交互匹配计算。对于该系统而言,如何提高系统问句理解模块归属查询语句类别的能力;如何提高系统问句检索模块度量语义等价的能力;如何提高答案生成模块中查询语句与候选答案集的文本交互匹配,这些是本文的研究重点。因此,本论文的主要研究工作及成果为,构建了一种基于词性特征的CNN_BiGRU问题分类模型;构建了一种基于注意力k-max池化BiLSTM网络的问句相似度模型;构建了一种基于attention_BiGRU交互匹配的答案置信度模型。(1)构建了基于词性特征的CNN_BiGRU问题分类模型。该模型包含了文本向量化技术、CNN、BiGRU。其中,针对传统向量方法辨别段落文本中多义词的不足,提出引入词性属性来辅助向量化文本。此外,鉴于CNN、BiGRU各自能捕获不同粒度的高阶特征,提出组合CNN与BiGRU形成CNN_BiGRU。该模型会在不同粒度层面抽取信息,以获取蕴含不同语义的高阶表示,从而增强分类能力。(2)构建了基于注意力k-max池化BiLSTM网络的问句相似度模型。该模型由CNN卷积、注意力池化、k-max池化、BiLSTM网络构成。由于传统相似度算法学习的语义信息较浅,导致语义相似性不佳,为此构建新的相似度模型。其中,针对CNN卷积时未能量化卷积表示的贡献度,于是,结合注意力池化与k-max池化共同来聚焦卷积表示,而后,利用BiLSTM的双向编码机制聚焦并捕捉表示的潜在信息,以便生成高级特征。实验分析表明,该模型可较为全面的关注并获取对应层级的语义表示,有效提升了语义相似性的准确率。(3)构建了基于attention_BiGRU交互匹配的答案置信度模型。此模型借鉴了Siamese Network结构框架与交互匹配模式,将attention机制、BiLSTM网络应用其中。对于语义匹配任务,若采用并列式匹配则会导致匹配的语义粒度较浅,为此,采用交互式匹配,以便能在不同匹配层面关注文本交互信息,并抽取深层交互语义。基于实验结果,该模型在评价指标上表现优异,证明具有出色的语义匹配能力。