基于Spark并行框架的推荐系统研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:weike112121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展和日益普及,人们越来越多得选择通过互联网获取信息的方式,比如使用门户网站或手机应用获取新闻信息、网上购物等。伴随着各类信息网站和移动应用的增加,互联网上的信息正在以爆炸式的方式增长,这些信息一方面满足人们对智能化生活的需求,另一方面严重的信息过载问题困扰着人们做出符合自己需求的选择。推荐系统作为解决信息过载的有效方法,它能够主动地为人们推送他们可能感兴趣的信息,节省人们在信息筛选上花费的时间。推荐算法作为推荐系统的核心,它决定了推荐系统的推荐结果准确性。为了有效提高推荐系统的准确性,本文提出一种基于Spark并行框架的推荐系统,它是一种以基于GBDT混合推荐算法为基础的Spark并行推荐系统。本论文的主要研究内容包括:1)基于协同过滤的推荐算法的验证:对传统的协同过滤算法进行验证,分析不同协同过滤算法的原理,对比并总结不同协同过滤算法的优缺点和适用场景。2)基于GBDT的混合推荐算法:根据传统的协同过滤算法的优点与不足,本文提出采用一种基于GBDT的混合推荐算法以克服传统协同过滤算法的缺点,提升推荐算法的推荐准确率。对比其他模型集成策略,如线性加权、融合、随机森林等集成算法,阐述基于GBDT的混合推荐算法的优势。3)基于Spark并行架构的推荐系统:利用Spark的高性能和易用性,实现基于Spark并行框架的推荐系统,用于提升基于GBDT的混合推荐算法的执行效率和解决海量用户数据下基于GBDT的混合推荐算法面临的性能瓶颈等问题。实验结果表明,本文提出的基于Spark并行框架的推荐系统可以高效准确的为用户推荐信息。一方面采用基于GBDT的混合推荐算法可以有效的提高推荐算法的准确率,另一方面采用Spark并行框架实现的推荐系统可以提高算法在海量数据下的运行速度和并发性能。
其他文献
目的探析在冠心病治疗中分别应用瑞舒伐他汀与阿托伐他汀的临床效果。方法选取我院2015年04月到2017年04月接收的冠心病患者58例为研究对象,并利用随机数字量表法分为对照组2
通过分析信息化教学模式、拉斯韦尔的5W传播模型,充分结合虚拟现实技术的交互性、沉浸性与想象性特点,得出虚拟现实技术支持下科普教育模式的要素,分析了要素内涵及其关系,结
目的:了解我国部分地区市售动物源性食品中邻苯二甲酸酯物质(PAEs)含量及分布情况,为开展食品中PAEs的风险评估提供数据支持。方法:2012—2013年在我国7个省、直辖市大、中、
<正>古代长篇歌行中,最著名的莫过于唐代白居易的《长恨歌》,曾被后世奉为歌行中的"绝唱"。《长恨歌》采取安史之乱前后唐玄宗李隆基与
目的观察针刺联合康复训练治疗小儿脑瘫的临床疗效及对患儿肢体运动功能和脑血流的影响。方法将2011年4月至2016年8月于我院针灸科就诊的81例脑瘫患儿随机分为对照组40例和治
<正>如今,小学语文阅读教学似乎成了教师的演讲阵地。课堂上,教师精雕细琢的讲解、分析,试图通过大剂量的强行灌输,让学生理解、掌握甚至运用。可结果呢?学生越是经过这样的
作为“加快发展海洋经济”的一环,海南三亚市政府近日表示,将继续推行海域使用公开招标、拍卖制度,开发东锣、西鼓岛两座无人岛,并表明绝不搞房地产开发。$$   三亚市海洋与
报纸
本论文运用配位聚合物和超分子的构筑策略,选用2-氰基吡啶衍生物为新型有机配体,在适当的条件下与金属离子组装制备出结构新颖的金属超分子配合物。重点研究了这类配体的结构
目的:探索经过6年脊髓损伤者群体生殖康复需求的变化,为制定相关政策,提高脊髓损伤者康复服务质量提供依据。方法:本研究对53名18岁以上未生育子女的脊髓损伤者进行问卷调查,
中医眼科传统理论重视中眼局部与整体的相关性,文章详述了黄帝内经对眼目的认识、玄府学说、肝窍穴说、五轮八廓学说,对其渊源、发展、应用和后世医家的临床应用与发展进行了