Spark并行化基于物品协同过滤算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:CHEUNGKWOKKUNG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的基于物品(Item-Based)协同过滤算法处理海量数据时耗时过长和效率低下问题,提出基于Hadoop分布式平台以及Spark并行计算模型的Item-Based协同过滤算法。综合考虑推荐系统的执行效率和推荐质量,通过对ItemBased协同过滤算法的改进,实现一个Spark并行化的音乐推荐系统。选取部分KDD Cup比赛数据集在推荐系统中进行测试,为目标用户生成音乐推荐结果和评定推荐误差,实验结果表明,改进后的算法在执行效率和推荐质量方面有了显著提高。
其他文献
方法是研究的工具,方法论对于学术研究来说是十分重要的,而20世纪是中国古代文学研究方法论的发展成熟期,达到了前所未有的高度,但世纪末方法论热有所消退,值得我们去回顾与
认知心理学是研究人类有关认知过程结构的学问。了解读书、计算、推理、制定学习计划等等各种各样的认知活动的结构,了解语言情报处理过程中的构筑过程,是认知心理学最重要的
为研究某大推力氢氧发动机真空羽流效应,设计采用火炬点火方式的60N缩比氢氧发动机.通过球头密封声速喷嘴组件控制流量,使真空下每个声速喷嘴组件减少3个密封面.进行真空点火
水资源对于人类的重要性不言而喻,尤其地表水更是人们饮用、使用的重要资源。但是,随着地表水资源污染严重情况的发生,对其进行测定则能够有效降低其对人们身体的损伤。尤其
保密性是国际商事仲裁的特性,但随着WTO透明度基本原则以及投资仲裁透明度改革的逐步深入,国际商事仲裁领域也掀起透明度改革的浪潮。推动透明度改革的可能性来自于仲裁机构之
卤代(杂)芳烃作为天然产物、医药和有机材料的基本结构单元,是一类极其重要的化学合成原料,在有机材料合成及医药研发等领域被广泛应用。卤代(杂)芳烃因其所含的卤原子官能团可以
本文以Halliday系统功能语法为框架,研究了英文推销信中人称的人际意义。推销信中的人称使用充分体现了语言的人际功能。在推销信中巧妙运用人称指示语可以操纵读信人,使推销
矮紫堇为我国青藏高原地区民间常用藏药,主要含有生物碱、黄酮、三萜等化学成分,药理活性多样,具有解热、抗炎止痛、保护心脏、抗血小板聚集、抗乙酰胆碱酯酶、抗氧化等药理
地表水监测中铁锰的监测方法主要是原子吸收分光光度法。而在样品的采集保存上要求不明确。地表水环境监测技术规范中要求是现场采集后静置半小时取上清液,而水质铁、锰的测
利用现代信息理论,提出了信息权的概念并建立了信息权模型.采用分级计权方法,反映了要素及要素与因子间的作用程度及层次关系,并采用数理逻辑推理,避免了人为因素干扰.适合于地质环