论文部分内容阅读
近年来,由于旅游业的迅速发展,旅游信息成为人们关注的焦点。目前的旅游信息大多为旅游网站提供,对用户提出的问题回答的准确率还很低。如何使得计算机正确理解用户提出的问题,一直以来都是问答系统研究的关键。问句分析是问答系统中重要的一部分,它直接影响问答系统后续阶段的处理。问句分析包括问句分词、词性标注、句法分析、句型分析等,本文重点研究其中的句型分析。句型分析对答案的提取、问句的语义分析,以及问句的形式化扩展都有很大的帮助。本文提出一种基于本体和汉语框架网(Chinese FrameNet,简称CFN)的句型分析方法,研究如何把语义角色加入到问句分析中,并将该方法应用于旅游本体库的问答系统中,进而对本体答案进行抽取。本文采用框架语义角色标注的山西旅游景点问句作为语料来源,将CFN的语义角色标注应用到旅游领域的问句分析。该方法在很大程度上提高了问句的语义理解,为问句分析提供了一种新的研究方法。本文的主要工作包括:1根据本体的定义和旅游领域的标准,构建了旅游问答原型系统。2本文通过对问句句型的分析,研究如何把语义角色加入到问句分析中,提出了一种基于本体和CFN的句型分析方法。同时在传统分类的基础上结合本体库的特点,对问题分类进行细化。3以交通问句中“方法”类为例,通过CFN语义角色标注和问句类型的结合,制定不同的模板和策略,从而抽取有用的本体三元组信息。通过对该类问句进行实验,验证了该方法的可行性和有效性,提高了问题的召回率。