基于协同过滤模型与隐语义模型的推荐系统研究与实现

被引量 : 0次 | 上传用户:lummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,人们越来越习惯于使用电子商务网站来购买商品。然而,电子商务网站提供的海量商品使购买者很难快捷的做出决策,他们在寻找满意的商品时需要花费大量的时间和精力。如何通过一种有效的机制来帮助人们缩减获取信息过程中耗费的时间代价,同时保证信息的质量,是目前电子商务研究的热点和难点。推荐系统可以为用户带来轻松购物体验,并专注于感兴趣和需要的物品或信息。本文研究基于协同过滤模型与隐语义模型的推荐系统理论与实现方法,主要对协同过滤推荐算法模型比较;融合隐语义模型和邻域模型的推荐算法优化;基于融合模型的推荐系统的设计等三个问题进行研究。在此基础上提出了一种优化算法并通过在Netflix数据集上的比较实验论证了算法的正确性。本文文根据个性化推荐系统的发展趋势,分析了基于协同过滤的推荐系统的各种算法,包括基于邻域的协同过滤算法和基于模型的协同过滤算法机制与理论。分析了协同过滤算法实现推荐的构建评分矩阵、计算相似度、预测与推荐等三大步骤。通过在movielens数据集上进行分析与实验,比较了不同相似度度量对推荐精度的影响以及不同协同过滤算法在数据集上的表现,总结了各个推荐算法的优缺点。研究了隐语义模型的原理和在文本挖掘中的意义,改进了经典隐语义模型并提出了模型在推荐系统中的实施步骤。比较了基于隐语义模型的推荐算法与基于邻域的协同过滤算法的特点和局限性。提出了一种融合邻域模型与隐语义模型的改进推荐算法,并通过在模型中加入隐性反馈数据,进一步提高了算法的精度。在Netflix数据集上进行了实验比对,结果证明了新算法优于传统的协同过滤算法。本文基于开源平台搭建了一个推荐系统原型,给出了数据库结构和系统总体功能。以Mahout推荐系统引擎为开发平台,提出了推荐系统原型设计方案,实现了评分预测与推荐功能,达到了个性化智能推荐的目的,验证了方法的有效性。
其他文献
为开发适合于非常规油气藏压裂增产的压裂液体系,本文通过环保型胶凝剂双烷基磷酸酯的合成及络合铁交联剂的制备,分别以液化石油气(LPG)、正己烷、正辛烷、等作为基液,形成了
创意文化产业以人的创新创意为核心,以文化为元素,以金融为驱动,以科技为支撑,以市场为导向,以产品为载体,以品牌为目标,形成融合型的产业链,并通过产业发展进一步满足人民群
学生事务管理是指各个高校通过对学生的科学指导和规范约束以及人性化服务,从而有效促进学生的全面良好发展的相关组织活动。目前,各国的高校都十分重视学生事务的管理工作,学生
菊花(Chrysanthemum morifolium Ramat.)原产于中国,是一种药食同源的中药。其化学成分主要有萜类、黄酮类和多糖类等化合物,其中菊花粗多糖具有明显的免疫调节等活性,但进一
该篇论文对中国是否存在“股权溢价之谜”现象进行了再检验,“股权溢价之谜”的本质在于股票收益率远高于无风险利率,必须通过设置很高的相对风险厌恶系数才能解释如此高的溢
我们对事物的识别,首先要把握的是物体的形状,即图形。形的世界,无限丰富,千姿百态。只要我们留心观察周围的事物,就可以发现许多让你无法忘怀的形态。由于科技的飞跃发展,电
基于磁力泵的无泄漏特性,解决电厂设备的泄漏问题。分析磁力泵的设备结构及其优点,针对使用过程中出现的故障进行研究。
抛丸清理工艺是一种表面处理技术,它是通过抛丸器叶片的高速运动利用离心力将弹丸高速抛落冲击在工件或物体表面,达到清理强化的效果。与其他表面处理技术相比来说,它更快、更有
随着3G网络在中国的开展、智能移动终端的普及和移动互联网用户的持续增长,促进了移动广告产业的迅速发展。互动、个性化的移动广告成为人们方便获取信息的有效途径,其低成本特
机械制造业是我国现阶段大力发展的支柱性、战略性产业,具有涵盖范围广泛、产业关联度高,对经济增长拉动作用显著的特点,不仅带动整个国民经济的快速发展,同时也在很大程度上