论文部分内容阅读
随着电子商务的快速发展,人们越来越习惯于使用电子商务网站来购买商品。然而,电子商务网站提供的海量商品使购买者很难快捷的做出决策,他们在寻找满意的商品时需要花费大量的时间和精力。如何通过一种有效的机制来帮助人们缩减获取信息过程中耗费的时间代价,同时保证信息的质量,是目前电子商务研究的热点和难点。推荐系统可以为用户带来轻松购物体验,并专注于感兴趣和需要的物品或信息。本文研究基于协同过滤模型与隐语义模型的推荐系统理论与实现方法,主要对协同过滤推荐算法模型比较;融合隐语义模型和邻域模型的推荐算法优化;基于融合模型的推荐系统的设计等三个问题进行研究。在此基础上提出了一种优化算法并通过在Netflix数据集上的比较实验论证了算法的正确性。本文文根据个性化推荐系统的发展趋势,分析了基于协同过滤的推荐系统的各种算法,包括基于邻域的协同过滤算法和基于模型的协同过滤算法机制与理论。分析了协同过滤算法实现推荐的构建评分矩阵、计算相似度、预测与推荐等三大步骤。通过在movielens数据集上进行分析与实验,比较了不同相似度度量对推荐精度的影响以及不同协同过滤算法在数据集上的表现,总结了各个推荐算法的优缺点。研究了隐语义模型的原理和在文本挖掘中的意义,改进了经典隐语义模型并提出了模型在推荐系统中的实施步骤。比较了基于隐语义模型的推荐算法与基于邻域的协同过滤算法的特点和局限性。提出了一种融合邻域模型与隐语义模型的改进推荐算法,并通过在模型中加入隐性反馈数据,进一步提高了算法的精度。在Netflix数据集上进行了实验比对,结果证明了新算法优于传统的协同过滤算法。本文基于开源平台搭建了一个推荐系统原型,给出了数据库结构和系统总体功能。以Mahout推荐系统引擎为开发平台,提出了推荐系统原型设计方案,实现了评分预测与推荐功能,达到了个性化智能推荐的目的,验证了方法的有效性。