论文部分内容阅读
FAQ(Frequently Asked Questions)问答是智能客服系统的重要组成部分,用于回答业务领域内的常见问题,在节省人工成本的同时提升服务效率。FAQ属于面向常见问题集的检索式问答系统,检索过程分为初步召回和精准排序两步,其中的关键技术均为语义匹配。随着客服领域的扩展和智能化需求的提升,目前的语义匹配算法存在多种局限。首先,模型在不同领域数据之间的适配性较差,但能用于训练专用模型的语料有限;其次,召回阶段使用的传统语义匹配算法对深度语义匹配薄弱会漏掉部分正样本,直接影响排序阶段的匹配空间;最后,排序阶段深度语义匹配算法对“细粒度”特征捕获不足,且在FAQ场景下的匹配准确率不高,对用户意图的理解存在偏差。因此本文针对FAQ问答系统关键语义匹配算法面临的迁移适配性和识别准确性问题,对召回阶段和排序阶段的模型进行改进和优化。具体内容包括:(1)针对FAQ问答场景下由于召回阶段语义匹配算法对深层语义捕获不足导致召回率低的问题,本文设计了一种基于混合方式的召回算法。首先引入使用孪生网络结构训练的深度语义向量编码器Siamese-BERT来捕捉深层语义,然后与传统语义匹配算法BM25结合,发挥两者的共同优势。使用对企业真实FAQ数据采样的问题数据进行测试,混合召回算法相对单独使用BM25算法和深度语义向量匹配算法均提升了召回率,且在不同领域数据的适配上有良好表现。(2)针对排序阶段对“细粒度”特征捕获不足和匹配准确率不高直接影响回复效果的问题,本文提出一种基于BERT模型改进的多特征融合深度语义匹配算法MFF-BERT。首先通过加入人工监督信号的方式使模型关注“细粒度”特征,然后结合FAQ场景匹配特点加入“类别”识别特征,最后将两种特征与原始BERT模型融合。实验结果表明,在FAQ场景下,本文改进的多特征融合深度语义匹配算法相比原始BERT模型准确率提升了 5.3%,且在不同领域数据中改进算法都有良好的提升效果。(3)基于上述两点对算法的改进,本文设计并实现了 FAQ问答系统匹配相关模块,具体包括提供数据支持的知识库构建模块、基于混合方式召回算法设计的召回模块,基于多特征融合深度语义匹配算法设计的排序模块三部分。在实际场景中验证了算法的实用价值,为FAQ问答场景下匹配算法的改进和应用提供了新的解决思路。