论文部分内容阅读
互联网的迅速发展为我们带来了大量数据,但同时也伴随着信息的超载、浪费等问题。首先,信息超载问题严重困扰着消费者。用户若想从巨大的信息流中挖掘自己真正喜欢的内容是有一定难度的事。其次,信息超载问题也严重困扰着商家。当前面临着消费升级,这就需要商家将原来的规模化经营战略转变成差异化经营战略,针对每名用户的差异性提供个性化服务。因此,一个更加主动,更具有个性化的商品推荐系统,对于消费者和商家来说都是切实需要的。协同过滤在个性化推荐系统中得到了广泛的应用,但是随着实践的不断深入,协同过滤在推荐过程中暴露出了很多问题。本文主要做了以下研究工作:1、首先,在推荐系统研究的历史发展进程前提下介绍了当前个性化推荐系统中经常使用的算法,包括协同过滤和关联规则两大类推荐方法,并指出了算法中存在的“数据稀疏性”现象;2、其次,充分研究推荐过程中出现的“数据稀疏性”现象,提出了基于用户聚类改进的协同过滤方法,该方法就原始k-means聚类算法在择取原始的中心值点时的不足,通过计算数据之间差异性,重新定义了择取原始中心值点的原则,防止了因为随机择取原始中心值而造成聚类类别不确定性的现象发生;3、最后,根据本文所提出的改进后的推荐系统方法,进行了对“豆瓣用户进行书单推荐”的试验,将优化之后的方法实行了有效性检验。并且该试验完整展示了用“基于用户聚类的协同过滤推荐”对豆瓣读者进行书单推荐时的详细步骤。