基于T-CRFs模型语义标注在智能问答系统中的应用研究

被引量 : 2次 | 上传用户:zhouyu_yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能问答近年来非常受人追捧,因其回复结果准确直接,也一直是自然领域处理的热点。自腾讯公司推出微信产品之后,智能问答服务代替人工客服的需求越来越旺盛。而市面的一些所谓智能问答只是基于关键字、关键字堆砌来实现的,根本没办法做到了解用户意图,做到精准回答的目的。本文的研究能够提高智能问答系统在某些领域的用户理解、问答精准率和问答效率。本文使用依存句法分析,抽取了依存树中父节点和子节点层面的特征,在T-CRFs模型中进行训练,使得标注结果在词与词性层面特征的基础上有一定程度的改善。实验选用上海好问角网络科技有限公司的汉语框架网络知识库中的“购买”框架下的句子库,加入父节点和子节点相关特征的最优模板,框架元素自动标注结果的准确率73.62%,召回率48.26%,F值为58.30%。而与“购买”框架领域相关的智能问答系统在精准率和回答速率上面均有了显著的提升。本文直接从语义标注方面来解决智能问答知识库的标注问题和智能问答精准率和回答速率的问题。语义标注在问答系统的问句的匹配、答案抽取过程起到至关重要的作用,同时也是智能问答系统能否理解用户意图和答案能够精准呈现的关键过程。本文在对应用的知识库进行语义标注模型中引入依存句法分析和T-CRFs模型,使得实验最终在准确率、召回率和F值均有明显提升的汉语框架网络知识库应用到智能问答系统中,来验证智能问答系统在精准率和问答速率上面的提升。将汉语框架网络知识库进行汉语框架语义标注应用到智能问答系统中,可以解决目前问答系统不能够理解用户意图、有时答非所问和回答速率慢的问题,这将给依存于微信等一系列互联网商家提供了一个直接与用户直接交流和省掉人工费用的机会。同时将依存句法分析和T-CRFs模型相结合训练知识库语料,不仅能够将浅层次语义的标注结果进行很好的展示,同时也给深层语义分析提供了一种向深入分析的方法。
其他文献
月桂并非我国原产的乡土植物,它老家在地中海一带,是典型的亚热带地中海气候型植物。在原产地栽培历史十分悠久,并且是当地人心目中勇敢、自由的象征。月桂早年引种于南京、
期刊
目的分析丹红注射液与不同输液配伍时不溶性微粒的变化。方法丹红注射液分别与6种输液配伍,用微粒分析仪测定配伍前后的不溶性微粒数,并进行对照分析。结果丹红注射液与6种输
目的:分析糖尿病患者内分泌激素及内皮素(ET)、一氧化氮(NO)水平的变化,探讨性激素及ET、NO水平对糖尿病患者精液质量的影响。方法:根据空腹血糖水平将157例研究对象分为正常
目的:分析孤独症儿童早期听觉统合治疗的临床疗效。方法:选取本院收治的孤独症患儿82例,采取分层随机法分成两组,对照组(n=41)采取常规康复干预治疗,观察组(n=41)在此基础上,采取早期听
现实中发生的火灾,火源形状由轴对称到线性不等,可以近似处理为不同长宽比的矩形。前人针对矩形火源竖向燃烧的火羽流行为与特征参数演化规律开展了较多的研究,但是对于一些
针对模型确认中的确认度量问题,构造实验观测数据经验概率分布的置信包络.通过计算其与模型响应概率分布之间距离的上/下确界,给出基于概率分布距离确认度量的置信区间.通过
目的1.探索借助微信平台,建立适用于出院后回肠膀胱造口患者康复进程的个性化教育方案,为回肠膀胱造口患者在住院期间及出院后的康复过程提供身心一体的延续护理;2.探讨该移
开展遥感图像分割的研究,对人们在遥感数据日益增长的需求处理方面有着十分重要的意义,而遥感图像的复杂、多光谱多层次等特性使得遥感图像的分割一直都是遥感图像处理领域的
背景糖尿病肾病(diabetic nephropathy,DN)是糖尿病患者中最常见的微血管病发症之一,调查显示亚洲人群Ⅱ型糖尿病患者中糖尿病肾病的发生率较高,尽管积极调节血糖使之处于理想的范
论文以全麦粉取代沙琪玛配方中不同比例的高筋粉,研究了全麦粉对沙琪玛面团以及产品品质的影响,优化了制备高营养、低脂肪全麦沙琪玛的工艺,并对全麦粉降低沙琪玛含油率的机理进