【摘 要】
:
协同过滤是推荐系统中最广泛使用的推荐算法。针对单机模型已经不能满足推荐系统的实时性与扩展性,提出一种基于Spark的分层协同过滤推荐算法。算法首先基于用户时间行为序列
【基金项目】
:
国家高科技研究发展计划(863计划)(2014AA015204);山西省国际科技合作项目(2014081018-2);山西省科技基础条件平台建设基金项目(2013091003-0103)
论文部分内容阅读
协同过滤是推荐系统中最广泛使用的推荐算法。针对单机模型已经不能满足推荐系统的实时性与扩展性,提出一种基于Spark的分层协同过滤推荐算法。算法首先基于用户时间行为序列构建用户兴趣模型;其次基于RDD实现了并行化EM聚类算法,将用户划分为不同的用户簇;最后基于不同的用户簇实现了并行化Item-based协同过滤推荐算法。通过阿里巴巴天池数据集实验表明,该算法可明显减少推荐时间并提高了推荐准确度,具有良好的可扩展性。
其他文献
橡胶坝技术已广泛应用于低水头拦河工程建设,在水利、水电、水运、市政等各方面的实践,己证明其强大的生命力。橡胶坝充排水设计是橡胶坝控制系统的主要设计内容,通过分析工
为解决电力调度信息纵向交换的难题,提出并开发了基于面向服务架构(service-oriented architecture,SOA)的纵向数据交换平台建设思路,通过统一的数据交互服务规范及数据标准,
<正>高校微博作为高校与外界沟通的新平台,展示学校形象是其主要功能之一,其传播方式具有裂变式和跟随性的特点,更适合作为高校形象的窗口,宣传学校品牌;同时作为平等交流的
以太无源光网络(EPON)已成为国内外接入网技术的最新研究热点,而EPON标准正在制定。针对EPON系统的核心关键技术之一的上行信道带宽动态分配问题,参照APON的G.983建议,提出了
<正>近日,在《快乐大本营》节目现场,主持人谢娜表演魔术时,黄磊的女儿多多在旁"捣乱",揭穿魔术真相,导致谢娜无法表演下去。谢娜情急之下,用手掐住了多多的脖子,此举引发了
论述了绒山羊毛囊结构的周期性变化,以及其与产绒量和绒品质的关系的研究现状。绒山羊的产绒能力直接与其皮肤中的次级毛囊总数有关,S/P比值越大,产绒量越高。而且其毛囊发育和
季节性雨林是广西南部北热带地区的地带性植被类型。本文主要介绍酸性土地区季节性雨林的类型 ,记录了下列几个群系 :1、以窄叶坡垒为主的季节性雨林 ;2、以擎天树为主的季节
结合南方电网调度信息披露系统的建设,就其过程中遇到的一些核心问题进行探讨,包括信息披露范围的界定,披露信息的分层、分区、分对象特征分析,披露业务不确定性带来的灵活设
电力行业在推动我国低碳发展中占据重要的地位。作为电力行业的重要组成部分,电网企业应当积极思考自身的低碳发展技术途径,引领电力行业乃至全社会的低碳发展。以广东电网为
松嫩平原沙土区严重退化,不同植被对土壤影响的数据有助生态恢复,但相关数据匮乏严重。本研究以松嫩平原核心区新店林场的农田、草地、杨树林、落叶松林、樟子松林和榆树林等