基于深度学习的电商领域的自动问答系统的研究与实现

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:zhj8028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上每天都会产生大量的数据,用户希望能够从大量数据中快速获取所需内容。现有的检索信息的方式已经不能够完全满足用户的检索需求。用户希望能够直接检索到自己真实需要的内容,而不是检索出大量的相关文档,再去依次查看每一个文档,寻找是否文档中包含自己寻找的内容。自动问答系统是一种常见的信息检索形式,可以快速并且准确地解答问题。自动问答系统已经应用到了不同领域,它是目前人工智能和自然语言处理方向的一个研究热点。现如今,我国的电商行业蓬勃发展,线上购物已经成为了大多数用户的首选购物方式。随着电子商务用户的增加,电商网站的用户咨询量也随之增加。为了给用户提供更加优质的服务,需要构建专业并且庞大的人工客服团队。自动问答系统相对于人工客服,能够不受时间和环境的影响,二十四小时持续为用户提供专业的服务。在电商行业中,使用自动问答系统,能够承担部分人工客服的工作,为企业节约成本,提升用户的体验。因此,研究基于电商领域的自动问答系统,具有很大的应用价值。本文的研究目的是构建一个面向电商领域的自动问答系统。本文的主要研究内容包括以下几个方面。自动问答系统的核心部分是算法模块,本文针对电商行业的咨询特点,设计并实现了算法引擎模块。本文对自动问答系统进行了深入的研究,考虑到电商用户咨询的问题一般是目标驱动的,最终选择基于问答对的形式,构建问答系统。本文将问答系统回答用户的问题的过程,抽象成选择知识库中与用户问题最为匹配的问题的过程。这一过程实现的关键在于语义匹配算法。目前深度学习在语义匹配上取得了不错的成绩。深度学习算法的训练需要大量的数据,并且算法最终的效果与数据集的质量密切相关。本文收集了大量的客服数据,采用人工标注以及自动标注结合的方式,构建了一个电商领域的问答集。本文基于构建的语料集,实现了不同语义匹配算法,对比了这些算法在数据集上的性能表现。实验结果表明,基于卷积神经网络的算法模型效果最好。本文构建了一个完整的问答系统,并为问答系统提供了配套的知识库管理模块。本文实现的问答系统可以分为三大模块,问句解析、信息检索和答案生成。问句解析模块将用户的问题分类,分析用户的真实意图。信息检索模块从知识库中检索与用户问题最匹配的问题。答案生成模块获取问题的答案,将答案返回给用户。本文还为问答系统设计并实现了配备的知识库管理模块。知识库管理模块支持添加和修改问答对,为问答系统提供准确的训练数据。同时,知识库管理模块可以统计用户的提问情况,以及问答系统的匹配情况,为分析和改进系统提供了依据。
其他文献
对称性是概率模型中的定性特征,其在数学和统计学中都起着非常重要的作用。因为对称性是许多统计模型的一个重要假设。例如,对称性假设在推导位置参数的点估计或区间估计中是
随着现代科技飞速发展以及电子设备普及程度不断提高,电磁波不仅与军事领域相关,而且与我们的日常生活也是息息相关。长期过量的电磁辐射不仅给人们的生活造成许多不便,电磁
纤维素纳米晶体(CNC)因其棒状构型、表面大量羟基、低毒性等特点,在药物递送领域具有良好应用前景。本文制备了聚己内酯-b-聚甲基丙烯酸N,N-二甲氨基乙酯(PCL-b-PDMEMA)修饰
随着新型光伏材料的不断开发利用及光伏器件的不断优化,聚合物太阳能电池(PSCs)的光电转换效率迅速提高,表明PSCs具有商用化应用的巨大潜力。电子受体材料是光伏器件中重要的光
地应力是存在于地壳中的未受工程扰动的天然应力,也被称为岩体初始应力。地应力是引起采矿、水利水电、土建、隧道和其他各种地下或露天岩土开挖工程变形和破坏的根本作用力,
芸薹生链格孢(Alternaria brassicicola)是十字花科蔬菜的一个重要致病真菌,其侵染引起的黑斑病会导致十字花科蔬菜产、质量严重下降。对该病原菌致病机理的深入研究有助于黑斑病的防治。蓝光对病原菌的生长发育、有性生殖及无性生殖、体内的新陈代谢、产孢以及致病力等方面均能起到重要调控作用。因此,本研究从致病缺陷突变体AbS4b入手,明确其突变基因为蓝光调节蛋白基因Abblr,进一步对该基
剩余污泥中大多数有机物质存在于微生物细胞内,微生物细胞的细胞壁是一稳定的半刚性结构,起着保护细胞的作用。本文的研究是通过酸碱预处理联合文丘里管水力空化与双氧水复合
阈值公共物品是只有当加总贡献值达到或超过提供的临界点时该公共物品才会被提供,否则贡献将会被返还给个人。我们用结构性非参的方法分析了四种阈值公共物品提供机制——提供点机制(PPM)、返还机制(PR)、统一价格上限机制(UPC)、统一价格拍卖机制(UPA),基于实验中多时期的个人对公共物品的贡献值,我们能够识别人们策略的类别数、每种策略的函数形式以及基于前期结果的策略转移概率。我们将Hu(2008)的
采矿方案优选决定企业决策成败与经济效益好坏,在采矿方案优选的多目标数学决策中,保证指标权重获取的合理性与最优性,是优选体系构建的关键。为解决指标权重获取的合理性问
溜井作为简化矿山提升运输的系统,具有生产效率高,成本低的特点,在金属矿山地下开采中应用极为广泛,是多阶段运输矿山实现矿(废)石高效低成本下向运输,确保矿山安全高效生产