【摘 要】
:
问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。它允许用户以自然语言提问,并能够返回简洁、准确的答案,其研究兴起的主要原因是人们对快速、准确
论文部分内容阅读
问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。它允许用户以自然语言提问,并能够返回简洁、准确的答案,其研究兴起的主要原因是人们对快速、准确地获取信息的需求。在问答系统中加入语义信息是研究发展的必然趋势。然而,由于目前中文语义角色标注的准确率较低,直接将标注结果用于问答系统,会降低系统的性能。所以,大部分问答系统只采用词、词性、句法关系等信息。但是,仅使用这些信息很难继续提高系统的准确率。为此,本文提出了一种语义搭配验证法,并将它用于中文语义角色自动标注中,提高了语义角色标注的准确率。然后将语义角色信息用于问答系统的答案抽取中,提高了问答系统的精度。问答系统由问题理解、信息检索、答案抽取三个部分组成。本文主要研究了问答系统的问题理解与答案抽取两个部分。问题理解部分主要包括问题分类、关键词提取与扩展。本文采用贝叶斯分类器,提取问句主干以及包含疑问词的分支作为特征进行问题分类。答案抽取是问答系统中最关键的部分,抽取质量直接决定问答系统的性能。它的核心问题是:怎样才能抽取出包含正确答案的候选答案句。本文采用基于语义角色的问句-候选答案句匹配与基于统计的答案分类相结合的方法进行答案抽取,实验结果表明本文提出的方法具有较好的效果。
其他文献
考试报名相当重要,但也相当烦琐、难于管理。由于报名信息、数据过于庞杂,传统的人工报名管理方式已经远远达不到高效、准确等要求,这就要求有一套更先进的管理方式,而随着Intern
随着人类社会信息化的高速发展,多媒体传输已经成为当代网络研究的热点之一。视频作为一种生动直观且信息量丰富的媒体备受人们青睐,但是其巨大的信息量使得其在转发传输方面
随着数字电视的发展,广播电视由模拟向数字的转变已经是大势所趋。各国先后制定了各自的数字电视标准,而欧洲的DVB系统逐渐脱颖而出,其中DVB-T(数字地面广播电视)已经在各国有广
本课题是在课题组已实现的高速串行通信平台的基础上,进一步引伸,设计开源的PCI软核通信模块替代Xilinx公司提供的LogiCORE PCI核,力求在从模式下,做到占用资源更少,传输速度
随着大数据时代的到来,从海量数据中获取有价值信息的需求日益增加,迫切需要一些新的方法来处理海量数据。聚类分析作为数据挖掘中的重要组成部分,对数据挖掘技术的发展有着
医学图像配准是指在不同的时间、不同角度以及不同模态下获取的多幅医学图像,经过一系列的变换,使相同解剖结构(点)在同一空间坐标位置上一一对应的操作。图像配准是医学图像
电子支付是电子商务中最核心和最关键的环节,是电子商务得以顺利进行的基础条件。由于电子支付需要在开放的网络上进行,所以支付过程中敏感信息需要各种机制来保证其安全性,
Internet信息的迅速膨胀,在为我们带来海量信息的同时,也容易使我们在Internet中迷失方向。搜索引擎的出现在一定程度上解决了这个问题,但是仍然无法很好地主动地寻找到我们
大型物体数字化采用视觉测量的手段来实现,为获得较高的测量精度,往往需要分块测量,利用三维曲面拼接技术将区域数据进行整合拼接,实现物体整体形貌测量。测量回转体时,因回
作为自然灾害之一的地震其破坏力极为巨大,地震的发生往往也是在不经意中,而带来的是重多的人员伤亡事故和巨大的经济损失。同时我国又为世界上发生地震活动较多的国家之一,