基于深度学习的语义匹配在FAQ问答中的研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jql002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FAQ(Frequently Asked Questions)问答是智能客服系统的重要组成部分,用于回答业务领域内的常见问题,在节省人工成本的同时提升服务效率。FAQ属于面向常见问题集的检索式问答系统,检索过程分为初步召回和精准排序两步,其中的关键技术均为语义匹配。随着客服领域的扩展和智能化需求的提升,目前的语义匹配算法存在多种局限。首先,模型在不同领域数据之间的适配性较差,但能用于训练专用模型的语料有限;其次,召回阶段使用的传统语义匹配算法对深度语义匹配薄弱会漏掉部分正样本,直接影响排序阶段的匹配空间;最后,排序阶段深度语义匹配算法对“细粒度”特征捕获不足,且在FAQ场景下的匹配准确率不高,对用户意图的理解存在偏差。因此本文针对FAQ问答系统关键语义匹配算法面临的迁移适配性和识别准确性问题,对召回阶段和排序阶段的模型进行改进和优化。具体内容包括:(1)针对FAQ问答场景下由于召回阶段语义匹配算法对深层语义捕获不足导致召回率低的问题,本文设计了一种基于混合方式的召回算法。首先引入使用孪生网络结构训练的深度语义向量编码器Siamese-BERT来捕捉深层语义,然后与传统语义匹配算法BM25结合,发挥两者的共同优势。使用对企业真实FAQ数据采样的问题数据进行测试,混合召回算法相对单独使用BM25算法和深度语义向量匹配算法均提升了召回率,且在不同领域数据的适配上有良好表现。(2)针对排序阶段对“细粒度”特征捕获不足和匹配准确率不高直接影响回复效果的问题,本文提出一种基于BERT模型改进的多特征融合深度语义匹配算法MFF-BERT。首先通过加入人工监督信号的方式使模型关注“细粒度”特征,然后结合FAQ场景匹配特点加入“类别”识别特征,最后将两种特征与原始BERT模型融合。实验结果表明,在FAQ场景下,本文改进的多特征融合深度语义匹配算法相比原始BERT模型准确率提升了 5.3%,且在不同领域数据中改进算法都有良好的提升效果。(3)基于上述两点对算法的改进,本文设计并实现了 FAQ问答系统匹配相关模块,具体包括提供数据支持的知识库构建模块、基于混合方式召回算法设计的召回模块,基于多特征融合深度语义匹配算法设计的排序模块三部分。在实际场景中验证了算法的实用价值,为FAQ问答场景下匹配算法的改进和应用提供了新的解决思路。
其他文献
当今社会人们对机器人的使用遍及生活的各个角落,其中对于变结构轮式机器人的需求也愈加强烈。本文从机器人的查普雷金动力学模型分析着手,完成了机器人在自行车模式下动力学模型的综合分析。然后对机器人自行车模式下的直线运动控制算法进行设计,并设计仿真实验验证控制算法的有效性。最后由于机器人智能化的现代需求,本文对变结构轮式机器人进行强化学习平衡控制,以此提高变结构轮式机器人对环境的适应能力。主要内容分为四大
骨干网是Internet流量的中枢传输系统,骨干网上的微小扰动会影响整个Internet的运行。骨干网拓扑可视化有助于快速定位网络故障,保障路由安全。本文设计并实现了一个骨干网拓扑可视化系统,用于对骨干网拓扑信息的重建、采集、分析、存储及可视化展示,从而为运营商及国家网络安全管理提供技术支撑。本文的主要工作包含以下几个部分:首先,对系统进行了需求分析和概要设计。需求分析包含总体需求分析、功能需求分