论文部分内容阅读
随着个性化推荐系统应用越来越广泛,推荐技术的研究也得到飞速发展。在广泛的个性化推荐技术中,协同过滤技术的研究和应用最为热门,但是在目前协同过滤推荐系统中用户评分数据非常稀疏的大背景下,协同过滤推荐系统的研究依旧面临着诸多问题和挑战。本文主要针对数据非常稀疏时传统的三种相似度度量方法过于片面或者不准确的情况,提出了一种基于互信息的用户相似度度量方法。本文主要研究了以下几项内容: 1)介绍了推荐系统的研究背景以及国内外研究现状,着重阐述了学者们结合信息熵对协同过滤系统展开的探索和研究。 2)分析了传统的三种用户相似度度量方法,包括Cosine相似度(Cosine Similarity)、皮尔逊相关系数(PearsonCorrelation Coefficient)、修正的Cosine相似度,并总结了各传统相似度度量方法的缺点。 3)在阐述了前人研究的成果和分析了传统相似度度量方法出现问题的成因后,本文提出了一种基于互信息的用户相似度度量方法,该方法通过计算两个用户对项目评分的互信息来衡量两个用户之间的相似度,并将Jaccard相似性系数引入到互信息相似度计算方法中,来弥补传统的相似度度量方法会夸大或缩小用户之间的相似度,造成相似计算准确度下降的缺陷。 4)将本文提出的互信息相似度度量方法应用到公开的MovieLens数据集上,把推荐的准确度作为评价标准,并与传统的相似度度量算法进行性能对比,实验结果表明,本文提出的的方法提高了推荐的准确度,改善了推荐系统的质量。