论文部分内容阅读
伴随着网络的不断发展,搜索引擎的发展也在不断的前进之中,并且日趋的成为了网络中的最重要的信息检索工具和一种至关重要的网络应用。搜索引擎的框架和检索模型是搜索引擎中的最核心技术,本文主要是对搜索引擎的框架和检索模型进行研究和改进,然后将其应用到专家检索系统中,最终为基于对象的规则化搜索引擎的设计做铺垫。本文的主要工作体现在一下几个方面:第一,本文介绍了应用最广泛的基于全文检索的搜索引擎的框架和检索模型。然后对最经典和最常用的检索模型进行了评价实验,在此基础上研究了统计语言模型在不同平滑方法下的不同表现。第二,针对专家检索任务的要求和特点,使用两阶段检索模型和专家窗口模型作为解决方案来完成专家检索任务。两阶段检索模型是在针对新检索任务时采用的一种新的检索方法,它是在利用一般的检索模型的基础上对检索的过程进行了一种新的改进尝试。当然这种尝试继承了一般的检索模型,这里作者将之前提及的检索模型根据具体的情况以优化的形式融入到两阶段模型中,在专家检索中获得了较好的检索效果。第三,对专家检索的的第二个方法——专家窗口,本文也进行了多模型的实验,并与两阶段的检索方法进行对比,选择出较好的检索解决方案作为校园对象搜索引擎的检索模型。第四,利用专家检索系统的检索模型来实现基于校园网内容的对象搜索引擎。该引擎不仅可以和普通搜索引擎一样返回文档的检索结果,还能返回和查询词相关的从语料中处理出来的相关对象,即以一种结构化的信息作为返回结果。在论文的最后总结全文,指出课题中有待进一步深入研究的问题。