论文部分内容阅读
随着互联网中信息量的快速增长,浩如烟海的信息世界具有无组织,分布广、结构复杂、动态变化等特点,搜索引擎作为信息检索工具成为人们生活中必不可少的一部分。独立搜索引擎的检索机制、算法、范围等的不同,导致同样一个检索请求在不同搜索引擎中的查询重复率很低,小于34%[1]。Lawrence[2]等研究表明,所有的搜索引擎策略中索引的Web页面都不超过页面总数的三分之一。因此,获得全面、准确、更符合用户需求的检索结果,就必须反复多次的调用不同独立搜索引擎进行检索,但是在查准率和查全率方面的缺点是独立搜索引擎与生俱来无法改变的事实。为了解决传统独立搜索引擎存在的以上问题,元搜索引擎技术应运而生。元搜索的出现使这些问题在一定程度上有所解决,这使得元搜索引擎得到了学术界广泛关注和迅速的发展。元搜索引擎整合了多个独立搜索引擎的搜索结果,在查全率方面有很大程度提高,但同时却暴露出大量重复冗余信息、噪声、系统查准率不高的新问题,并且元搜索引擎依然没有考虑用户个性因素,一个搜索请求适用于全部用户,搜索过程没有考虑用户个性因素,信息检索结果无法满足每位用户的个性化需求,这直接影响了用户信息检索的质量和效果。尽量减少不相关信息的干扰,并且快捷方便地检索用户需求的信息,是本课题所研究的内容,也是个性化元搜索引擎的最终目标。本论文中,较详细地描述了目前搜索引擎的发展现状和研究热点;并针对独立搜索引擎的不足之处,详细介绍了个性化搜索引擎的结构框架;在对个性化元搜索引擎的特点和基于用户模型的研究方法进行了深入研究分析的基础之上,改进了成员搜索引擎调度算法,提出了成员搜索引擎结果贡献量及多维排序中分块的概念,提出基于用户兴趣及检索词串和搜索结果的文本相关度的结果整合排序算法。论文的最后通过程序设计实现了个性化元搜索引擎系统,在该系统中对论文中所提出的算法进行了分析和实验,相比于一般元搜索引擎,查询显得更人性化,相比独立搜索引擎的查全率和查准率有着明显的提高,改善了用户的检索质量和检索体验。