基于规则的阅读理解问题回答技术研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:colawing1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,如何让计算机理解人类的自然语言,并运用人类的自然语言模拟语言交际过程,实现“人机对话”,已经成为人工智能的一个重要研究领域——自然语言处理。问答系统是目前自然语言处理领域中一个倍受关注并具有广泛前景的研究方向,而它的研究热潮也引发了另一相关领域的研究——阅读理解。阅读理解问答系统能够自动分析给定的一篇自然语言文章,并且根据文中的信息,为每个针对本篇文章提出的问题生成相应的答案。目前,国内外很多的科研机构都在进行着英文阅读理解问题回答技术研究,而研究应用于中文阅读理解问题回答技术却寥寥无几。本文正是对中文阅读理解问答技术进行了探索性的研究。本文首先介绍了基于山西大学自主开发的中文阅读理解语料库CRCCv1.1版的构建过程,该语料库为中文阅读理解问题回答技术研究解决了语料资源的问题。其次介绍了词特征规则和基本块特征规则,人工制定的规则是根据问句和候选答案句的对应关系构造的,并针对时间、人物、地点、数值类型的问题制定了问题回答规则。最后,运用规则的方法在CRCC语料上对中文阅读理解的四类问题回答进行了实验,其中利用正交试验设计对规则的权重进行了优化选取。本文实现了一个基于规则的问题回答系统,并通过实验对其性能进行了评价。在本文的实验中,我们采用HumSent准确率作为阅读理解问题回答评价指标。实验结果表明,采用人工编写规则,能够取得较为令人满意的结果。对四类问题在阅读理解语料库上的测试,分别达到88.24%、80%、94.12%、89.61%的HumSent准确率。但规则的制定依靠的是人的先验知识,具有很大的主观性,缺乏一定的客观性。
其他文献
面向服务机器人使用廉价的RGB-D摄像头自主构建室内3维地图的需求,提出一种鲁棒的图像对齐方法.基于特征点的匹配集计算帧间变换,使用随机抽样一致算法(RANSAC)消除误配,并改
在本论文中,我们主要考虑双重Ockham代数的两类子代数.它们分别为:一类特殊的双重K1,1代数的子代数类和交换双重de Morgan代数类.即K-代数和MDM-代数.所谓的K-代数(L;∧,∨,