论文部分内容阅读
与传统的搜索引擎相比,自动问答系统在理论上能够更好地满足用户的检索需求。但是,真实世界中的提问对于自动问答系统来说通常很复杂,主要是由于问答系统缺乏丰富的世界知识以及强大的自然语言推理技术。本体作为一种能在语义和知识层次上描述信息系统的概念模型的建模工具,它在知识建模上具有非常大的优势。将本体理论运用到自动问答系统的知识库建模中,势必会提升自动问答系统的性能。本文旨在探索如何使用领域本体的语义信息来提升自动问答系统的性能。一方面,基于知识库的问答系统的性能很大程度上取决于知识库的优劣程度,本文阐述了如何构建一个面向自动问答系统的、结构良好的领域本体知识库;另一方面,以本体知识库为基础的自动问答系统必然需要相适应的技术,本文提出了面向领域本体的问句分析方法以及基于领域本体的查询推理方法。最后,本文通过实验数据证实了所提出技术方法的可行性。1、选择旅游领域为研究领域,构建了一个较为合理的面向自动问答系统的领域本体框架,并选择山西省的一些特色景点作为其实例数据。从中对构建领域本体的方法、步骤及原则进行了尝试性研究。2、针对传统开放域问句分类并不适合于特定领域,提出了面向领域本体的问题分类体系;紧接着给出了基于CFN标注的问句分析方法,以达到提取问句结构化语义信息的目的;在答案提取过程中,提出了问句结构化语义信息映射到本体知识库的方法以及合理利用本体中规则推理的思路。3、为了证实所提出的一系列方法的可行性,构建了一个自动问答实验系统。通过多个实验最终表明,本文提出的方法是行之有效的。