论文部分内容阅读
互联网的快速发展将人类带入了信息时代,海量的信息使得用户难以从其中快速定位所需要的具体信息,从而出现了“信息过载”现象。个性化推荐技术的出现将用户从浩瀚信息检索查找中解放出来,成为一种继搜索引擎之后获取信息的重要方式,它不需要用户具体描述个人的信息需求,在用户无明确需求时其作用尤为突出。个性化推荐作为处理信息过载的重要技术,已在电子商务和社交网络等领域取得了十分广泛的应用。协同过滤因其推荐效果良好,算法简单,能够处理复杂对象,成为个性化推荐中最成功和应用最广泛的技术。其通过获取用户的历史数据,分析并预测用户潜在的兴趣,由此推荐物品。然而,协同过滤算法在现实应用中存在数据稀疏性和推荐不准确的问题。针对该问题,本文展开如下的研究:第一,针对推荐不准确问题,提出了一种改进基于加权信息熵相似度算法。计算相似度是协同过滤推荐中最为重要的一步,传统相似度的算法面临相似度计算不准确等问题,在数据较为稀疏时计算出来的用户相似度也常常面临结果不符合现实的问题。本文所提出的相似度算法,通过对用户的原始评分数据进行处理,利用用户间的评分差值的信息熵来度量相似度,并简化算法,通过实验与传统相似度算法进行比较,实验结果表明本文所提算法更加符合现实,有效降低了推荐系统的MAE值,使推荐精度得到提升。第二,针对数据稀疏性问题,提出一种融合用户特征和项目属性的协同过滤算法。传统的相似度算法仅仅依靠单一的用户评分值产生推荐,在数据非常稀疏时将很难做出准确的推荐,甚至无法推荐。针对此问题,本文提出新的算法,通过在传统相似度算法上加权基于项目属性的相似度算法,并在进行推荐计算时融合用户的活跃度,通过实验与传统算法进行比较,实验结果表明该算法比传统算法具有更好的性能,在传统算法无法做出合理推荐时该方法仍然能够做出较高的推荐精度。本文实验所采用的测试数据为MovieLens数据集,实验表明,本文所提出的方法能降低预测结果的平均绝对误差,可以提高推荐准确度。