论文部分内容阅读
随着大数据的发展,传统的推荐系统和基于Hadoop平台的推荐系统在计算能力和实时性上存在一定的缺陷。阐述Spark框架,简述协同过滤算法,对交替最小二乘(ALS)算法原理进行分析,然后搭建Spark框架及生态组件,同时采用HDFS分布式存储海量数据,考虑显式反馈数据和隐式反馈数据,以ALS算法为推荐算法模型反复训练数据,进行迭代更新预测评分,实现基于Spark框架的电影推荐系统,解决新用户存在的冷启动问题,增加基于电影排名的推荐模块如热门电影推荐、好剧推荐等功能,为新老用户提供个性化电影推荐服务。