论文部分内容阅读
随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,越来越多地得到研究者的关注。目前,几乎所有大型的电子商务系统,如Amazon,CDNOW,eBay,当当网上书店等,都不同程度地使用了各种形式的推荐系统。
本文研究的对象是电子商务推荐系统中的协同过滤推荐方法。最近邻协同过滤推荐是当前最成功的推荐技术,其基本思想就是基于评分相似的最近邻居的评分数据向目标用户产生推荐。由于最近邻居对项目(电子商务中的商品、电影、音乐等)的评分与目标用户非常相似,因此目标用户对未评分项目的评分可以通过最近邻居对该项目评分的加权平均值逼近。
随着电子商务系统规模的进一步扩大,用户数目和项目数据急剧增加,导致用户评分数据的极端稀疏性,在用户评分数据极端稀疏的情况下,传统相似性度量方法均存在各自的弊端,使得计算得到的目标用户的最近邻居不准确,推荐系统的推荐质量急剧下降。针对用户评分数据的极端稀疏性,本文提出了一种改进的User-based协同过滤推荐算法,通过计算项目之间的相似性,初步预测用户对未评分项目的评分,然后采用一种合适的相似性度量方法计算用户的最近邻居。本文的研究内容主要包括:
1.对不同的电子商务推荐方法及其在电子商务推荐系统中的应用进行研究和分析。
2.详细研究和分析了传统的协同过滤算法在应用中所面临的问题和挑战,例如:推荐质量、可扩展性、数据稀疏性、冷开始问题等等,并介绍了现有的解决方法。
3.结合传统的协同过滤算法的思想,本文提出了一种User-based协同过滤推荐算法的改进算法,并设计了测试实验。
4.测试与比较改进算法与传统的协同过滤算法的推荐质量,并解释实验结果,验证了改进算法的合理性和有效性。
实验结果表明,User-based协同过滤推荐算法的改进算法可以有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的不足,显著地提高推荐系统的推荐质量。