问答式系统汉语语言理解技术的研究

被引量 : 0次 | 上传用户:carlos_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的快速发展和网络应用范围的不断扩大,WEB信息量呈指数增长,而传统的搜索引擎仅能从词的层面上来进行搜索,造成人们从WEB信息海洋中及时、全面、准确获取信息越来越困难。本文以特定领域为范围,针对传统的检索技术以及搜索引擎的弊端,对一种新型的信息检索系统——自动问答系统进行了研究。这是当前自然语言处理领域一个热门的方向,它同时也代表了将来搜索引擎的发展方向。自动问答系统综合运用了知识表示、信息检索、自然语言处理等技术,它能够使用户以自然语言输入问题,而不是关键词的组合。而返回给用户的是简洁、准确的答案,而不是一些相关的网页。和传统的搜索引擎相比,自动问答系统更加方便、准确。本文首先研究了需要在问答系统中使用的现有汉语自然语言理解关键技术(中文自动分词、句法结构分析、语义相似度计算、答案匹配算法、答案抽取),其中给出了一种改进的基于语义词典的句子语义相似度层次线性计算算法。在这些技术的基础之上,设计并实现了一个基于汉语语言理解的问答式系统。通过实验和测试验证了系统的有效性。该系统分为问题答案库、问题分析、答案查询、答案抽取四个部分。问题答案库中存取了领域知识、常见问题和原始文本库等数据;问题分析是对用户输入的问句从词法、句法上进行分解和分析,以掌握用户问题的真正意图;答案查询是使用问题分析中获取的关键词对问题答案库进行布尔查询,获得相关度高的答案列表;答案抽取是对这些答案进一步加工,抽取成句子或段落展现给用户。本文的主要贡献是基本实现了基于受限领域知识的中文自动问答系统原型,并通过一系列测试来验证系统的查全率和查准率,具有工程实用价值。所做的研究工作及其结果对相关理论研究及实际系统的分析设计和实现也具有一定的参考价值和指导意义。
其他文献
随着市场从卖方市场向买方市场转变,市场需求也从产品基本功能向多样化、个性化、多种产品附加特征转变,产品的生命周期日益缩短。面对日益复杂、动荡的环境,我国企业必须改
弱势群体问题是近几年来研究的热点,然而对弱势群体中残疾人问题的关注却很少。虽有一些学者对此进行了研究,但大多侧重于从公共管理学视角来探讨残疾人就业教育、福利保障以
通用动力机械(简称通机)行业近几年才在我国兴起并迅速发展起来。可短短几年时间,通机行业的竞争已白热化。重庆宗申通用机械有限公司(简称宗申公司)是宗申产业集团下的控股
近年来,虽然我国已经出现了一批在全国有影响的、集团性家装企业,然而,家装业在我国还只是处于起步与发展阶段。经营方式单一,营销方式简单是我国家装企业普遍存在的问题。在
试验在莲雾结果树上追施中微量元素肥料,结果表明:在莲雾花蕾期和果实膨大期增施中微量元素肥料,可有效改善果实外观品质,促进果实膨大,增加产量。
本文是对教育政策合法性的研究。教育政策合法性是教育政策的权威所在,是教育政策之所以被认同和接受的依据,是教育政策有效性的前提。改革开放以来中国教育改革的理论预设是
在医学院校及其它高等院校的教育管理工作中,人际关系日益受到重视。本文试图从人际关系影响因素这一途径探求医学生人际关系的相应管理对策。 首先结合国内外人际关系研究
随着世界经济全球化、一体化的快速发展和市场竞争的日益加剧,供应链日益成为企业经营活动中竞争模式的主流。然而在现实经济活动中供应链解体的比率一直较高,如何使供应链合作
长久以来,广告已经不仅仅是营销学的研究对象,在语言学、交际学、社会学、历史学等学科领域中,它同样受到学者们的青睐。现代意义上的广告已经不单纯作为商品的评价尺度,为了
中国的劳工权益保护非常薄弱。部分企业为追求经济效益的最大化而严重侵犯劳动者权益,这种现象已经成为一个普遍存在的社会问题。特别是农民工和矿工的权益缺乏保护,引起了舆