论文部分内容阅读
信息检索(Information Retrieval,IR)是从数据集中提出相关文档和信息的过程,而Web的出现改变了人们进行信息检索的方式,信息检索的对象也从结构化的数据转向半结构化,无结构化的数据。随着Web上数据的不断增加以及人们对查询质量的要求不断提高,传统的Web检索技术已经很难满足高质量的检索任务。语义Web技术是解决高质量检索、基于INTERNET分布式计算和知识发现和推理的有效方法,对搜索引擎来说,语义Web技术对于新一代搜索引擎的发展起着重要作用,同时也促进网络信息获取技术向高精度、智能化方向发展。 针对目前Web信息检索中存在的主要问题,本文对其中的关键问题,如提高查询结果的准确度和相关度,信息检索模型和算法,语义信息模型等方面进行了深入研究,把语义Web的资源描述框架(RDF),RDF模式(RDFS),Web本体描述语言(OWL)技术有机地结合到搜索引擎中,提出了若干有效改进Web搜索引擎质量和效率的方法并取得了满意结果。在完成语义Web的理论研究的基础上,我们实现了一个基于语义Web的信息检索系统ISeek,包括了RDF/XML解析器,RDF文档存储子系统,推理子系统,查询子系统等模块,它们有机地组成了一个搜索引擎的原型系统。