论文部分内容阅读
Web2.0、移动互联网和电子商务等技术的飞速发展在给人们带来便利的同时,也带来了信息过载问题,因为网络资源呈现出爆炸式地增长。如何解决信息过载问题是当前人们面临的一个重要问题,采用推荐系统是一种能有效解决这个问题的方式。推荐系统的质量在很大程度上取决于其所采用的推荐算法,协同过滤算法是目前最成功和应用最广的算法之一。然而,协同过滤推荐算法也面临着稀疏性和可拓展性等问题,随着推荐系统中用户和项目数量的迅速增加,这些问题会变得越来越严峻。为了缓解稀疏性问题对协同过滤算法的影响,本文从两个方面对协同推荐算法进行了改进。具体工作如下:首先,评分数据稀疏性会严重影响相似性计算的准确度,本文提出一种基于类别的协同过滤算法,该算法通过构造用户-类别矩阵实现降维,能有效缓解稀疏性。针对YueWu提出的用户-类别矩阵元素计算方法的不足,提出一种改进的计算方法,提高了相似度计算的准确度,从而获取更准确的用户兴趣近邻。其次,当邻居用户对目标项目无评分时,可以采用一些预测填充算法进行填充,Slope One算法因具有原理简单、易于更新和运算效率高等特性,而被广泛用于对评分的预测填充,能有效地解决稀疏性这一问题,但是该算法在预测的精度上表现的不是很好,因为Slope One算法忽略了用户的评分尺度差异这一重要因素,对此,本文提出一种改进的Slope One算法对用户评分尺度差异这一因素进行了处理,提高了预测评分的准确度。最后本文将改进的用户-类别矩阵计算方法和改进的Slope One算法相结合,提出一种基于类别和评分矩阵预测填充的协同过滤推荐算法。为了验证所提算法的效果,本文通过在MovieLens中的ml-100k数据集上进行多组对比实验,与传统的基于用户的协同过滤算法、基于原始的Slope One填充的推荐算法进行对比,采用平均绝对误差和均方根误差等作为评测指标,实验结果表明本文提出的两个改进点都有效地提高了协同过滤算法的精确度,此外,也验证了本文提出的推荐算法算法具有良好的推荐性能,能有效缓解稀疏性造成的影响。本文最后对全文进行了总结,并对后续工作进行了展望。