论文部分内容阅读
近年来,随着互联网的高速发展,现已进入到数据过载阶段,在构建互联网网站时需要考虑如何方便用户在庞大的数据中获取他所需的信息。传统的互联网企业的解决方式有两种,第一种是信息目录,如雅虎和新浪;第二种解决方式是搜索引擎,如谷歌和百度。两者的共同点是用户对自己的需求非常明确。但是互联网用户的现状是:大部分互联网用户对需求不明确。因此,推荐引擎应运而生。它主动向用户推荐用户可能喜欢的物品,不需要用户主动提供任何输入,而是通过在后台记录并分析用户行为数据,最后把分析结果作为个性化推荐推送给用户。本论文首先介绍了课题的研究背景,国内外研究现状及水平等,阐述了系统相关的理论基础,探讨了推荐系统相关技术与工具,确定了系统的体系架构。其次,详细介绍了推荐系统的架构、以及相关推荐系统的具体实现过程。最后利用Mahout框架把推荐引擎应用在大规模数据环境中。本论文的主要贡献包括:(1)分别实现了三种推荐引擎,并通过组合各种推荐策略的优点生成推荐列表。(2)记录并分析用户的反馈信息,以调整各种推荐引擎组合方式;以个性化的推荐引擎组合推荐物品;实验表明,使用了个性化引擎组合的方式产生的推荐结果比使用单个推荐引擎总体上获得更好的效果。(3)利用Hadoop的Mahout框架,把该推荐系统应用到大规模数据环境中。