论文部分内容阅读
互联网成为人们获取信息的主要来源,主导着信息的交互模式。面对快速增长的网络信息资源,用户很难快速从中获得自己感兴趣的信息,搜索引擎的诞生在一定程度上很好地缓和了这一问题。但是传统的搜索引擎没有从实质上解决上述问题,用户仍然不能得到很好的检索质量。针对以上遇到的问题,本文将与Web主题内容相关的多种因素融入到传统的搜索引擎中,提出了面向元搜索引擎的Web页面排序优化算法。本文首先介绍了搜索引擎的原理和分类,分析了如何解决传统搜索引擎遇到的问题,为介绍面向元搜索引擎的Web页面排序优化算法打下了坚实的基础。其次针对现有全文搜索引擎和元搜索引擎排序算法存在的问题,引入与Web主题内容相关的多种因素的概念,提出了面向元搜索引擎的Web页面排序优化算法。然后系统地介绍了面向元搜索引擎的Web页面排序优化算法,引入了关键词时间敏感性、结果竞价性、链接重复性、内容重复性、实词提取、词性干扰权重和近义词语义。最后针对算法中每个与Web主题内容相关的因素点进行系统模块设计,实现最终的元搜索引擎系统,并对实现的排序结果进行了实验结果评测。通过实验验证,确定了面向元搜索引擎的Web页面排序优化算法的优越性。