论文部分内容阅读
随着Internet的迅猛发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大的动态信息服务网站,为用户提供了一个极具价值的信息源。而传统的信息检索技术由于对这些信息的语义理解有限,越来越不能满足用户的检索需求。语义检索作为一种基于语义理解的信息检索方法,已成为信息检索研究的重点。由于本体具有良好的概念层次结构和对逻辑推理的支持,将其引入信息检索中的应用研究具有重要的价值。本体作为解决语义层次上Web信息共享和交换的基础,语义检索对其具有很强的依赖性,然而拥有一个涵盖领域内所有知识的本体是不可能。目前对基于本体的语义检索研究都假设本体中包含了所需的全部知识,未考虑本体中没有可用的知识对系统检索性能的影响。同时在本体的利用上,没能充分利用本体中的概念关系,影响了对文档语义理解的准确性。针对这些问题,本文提出了一种基于领域本体的混合信息检索模型。该模型结合传统的关键字检索和语义检索,使系统检索在没有可用的本体知识时,还可以通过关键字检索完成检索任务,保证一定的检索性能。模型充分利用本体中的概念语义关系,能有效挖掘信息的概念语义。另外,为验证模型的有效性,本文构建了计算机网络领域本体,并以此为知识基础,将混合信息检索模型与传统关键字检索模型进行对比实验。实验结果表明,基于领域本体的混合信息检索模型在平均查全率和查准率上都优于传统的关键字检索模型,证实了基于领域本体的混合信息检索模型的有效性。基于本体的语义检索有赖于人工智能、自然语言处理等技术的发展,本文的研究尚处于基础性的阶段。如何有效管理、利用本体,突破自然语言处理的局限性,并把基于领域本体的语义检索研究推向实际的应用,是今后工作的目标。