论文部分内容阅读
随着互联网大数据分析平台的高速发展,各行各业尤其是民生相关行业的用户数据分析掀起了变革的浪潮。“大数据”分析使得我们的碎片时间得以有效利用,传统的生活方式正在发生颠覆性的变化。如何有效地在海量的信息中准确获取所需的信息,并向意向人群有效推荐所需信息,使信息获取与搜索更高效,这是当下推荐系统研究的核心内容。本文通过对餐饮行业用户的消费习惯,针对两个关键属性(1)用户对餐饮商户的评分和(2)餐饮商户的地理坐标信息展开推荐系统的研究。通过对当下推荐系统的国内外研究现状以及推荐系统常用的算法进行原理分析,选择与关键属性关联度最高的基于物品的协同过滤算法和Geo Hash算法进行深度研究和应用。通过用户对餐饮商户评分计算出餐饮商户之间相似度,利用相似度得出推荐度评分,再通过Geo Hash算法快速匹配用户的实时坐标与餐饮商户的距离,从而推荐并满足用户所需的餐饮商户列表。因在单机环境在处理大数据时由于硬件的限制无法快速得出推荐结果,故本文提出了基于Hadoop平台的分布式存储运算框架对基于物品的协同过滤算法和Geo Hash算法进行优化,并通过实验验证了优化后推荐算法通过调度集群中多台服务器并行运算,比较单机环境下的运行时间明显降低,推荐效率显著提高。本文实现了为快速向目标用户推荐餐饮商户的目的。