论文部分内容阅读
随着计算机技术和网络技术的不断发展,Internet上的信息剧增。面对信息的海洋,用户试图通过浏览Web来发现信息、检索信息已经变得越来越困难,用户往往花费了很多时间却收获甚少。这时,用户可以通过搜索引擎来帮助检索有用的信息。现有的搜索引擎如Google、Yahoo和Infoseek等常常返回一个长长的搜索结果列表,用户不得不逐个的验证这些搜索结果片断是否是他们想要的结果,这是个很耗时的过程。 这个问题的一个解决办法是应用Web挖掘技术,对搜索结果进行聚类,使用户可以按组察看结果。但是,由于HTTP协议的无状态性,使得搜索引擎不能很好地跟踪用户的偏好,虽然有些搜索引擎可以对搜索结果打分并按得分的高低呈现给用户,但是一般没有考虑到用户的兴趣爱好,不同用户对于相同的检索关键词搜索出的信息是相同的。再者,传统的聚类方法一般不能解决按用户兴趣提供搜索结果的问题。 搜索引擎返回的结果太多且不能根据用户的兴趣提供检索结果是当前较受关注的问题。本论文把用户兴趣模型和STC聚类算法相结合,提出了改进的STC算法,并提出个性化推荐的策略和兴趣描述更新的方法,实现了一个基于搜索结果的个性化推荐系统(SRPRS)。SRPRS基于改进的STC算法自动组织搜索结果,帮助用户利用主题的方式发现所需的资源。通过实验,分析了SRPRS系统的聚类特性、时间特性和推荐精度。针对搜索引擎的列表显示结果,SRPRS系统在快速查找用户感兴趣的文档上有较好的性能。