元搜索引擎中结果聚合排序方法的研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:lanqishi1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何在互联网的海量信息中找到自己所需要的信息已经成为困扰人们的主要问题。元搜索引擎可以综合多个搜索引擎的查询结果,因而提高了搜索的覆盖率,但同时也带来了一些问题。元搜索引擎所得结果往往数目庞大,其中很多结果都与用户的查询没有太大关联。这直接影响了用户检索的质量,大大增加了用户检索的代价。为了帮助用户不受无用的信息干扰只获取所需的信息,本文对元搜索引擎所涉及的用户及网页技术进行了研究,提出了一种基于用户兴趣与网页分类的用户网页模型,并在此基础上对元搜索引擎的结果排序算法进行了改进。具体内容及研究成果如下:分析了用户与网页之间通过搜索引擎完成交互式的关系,提出用户兴趣与网页分类相匹配的多对多模型,并完成了兴趣与分类的转换规则的制定,建立了用户网页交互模型UPI。研究了用户兴趣分类的常用算法,提出显式反馈与隐式反馈相结合的用户兴趣信息获取方法,并完成基于UPI模型的用户兴趣自动更新的算法。深入的研究了网页自动分类技术,选取合适的训练集以及分类算法,完成了网页自动分类器的基本设定。在UPI模型基础上提出了网页类别更新的相关算法。研究分析了基于位置和基于相关度的结果排序算法,在这两种算法的基础上提出了基于UPI模型的排序算法。该算法通过分别计算网页位置分值,用户兴趣值和用户网页匹配值得出最终的网页分值,其中用户网页匹配值是基于UPI模型得出的。基于上述算法构建了相应的实验系统,通过实验验证了上述算法的搜索结果的有效性,并对其进行了相应的分析。
其他文献