论文部分内容阅读
在信息时代的今天,传统的基于关键词匹配的检索方法已经不能满足人们对于信息检索的需求,由于本体具有清晰的概念层次以及良好的语义表示能力,已经有越来越多的研究者把本体技术引入到信息检索领域中来,用于实现语义信息检索。本文将本体运用于检索系统,从语义上将内容进行匹配,可以大大提高检索的效率和精确度。给出了本体学习方法的讨论和研究,首先简要介绍了本体以及本体学习的基础知识,列举了几种现有的概念抽取方法,针对基于统计的方法只能抽取双字词的缺点,考虑加入基于规则的方法来提取出复合词,并且对于存在同义词关系以及整体与部分关系的概念,都提出了改进的方法进行抽取,实验结果显示了该方法的可行性。对于概念间关系的抽取,本文也进行了详细地论述,抽取分类关系时针对层次聚类存在选取聚类标准而影响聚类结果的缺陷,进行多次层次聚类,并且每一次聚类的过程中都选取不同的标准,这样就能提高关系抽取的准确度。抽取非分类关系则采用扩展的关联规则的方法来获取具体的关系名称以及定义域和值域。本文最后使用文章第三、四章介绍的本体学习方法构建了一个法律领域的本体,完成了一个基于本体的语义检索系统的实现,最终的系统运行效果说明了上述方法的有效性。