论文部分内容阅读
随着互联网的发展和大数据时代的到来,个性化推荐服务已经成为一种新的趋势。协同过滤算法是目前推荐系统中应用最成功和使用最广泛的技术之一,它根据近邻用户的兴趣偏好为目标用户产生推荐。这种算法在快速发展的同时也面临着数据稀疏性、冷启动问题等挑战。本文提出了一种基于用户评分和用户特征的混合协同过滤算法,该算法综合考虑用户特征和用户评分计算用户之间的相似性。同时,本文又将用户特征划分为用户人口统计学特征和用户话题特征,并建立了用户人口统计学特征与话题特征的对照库。若目标用户为老用户,通过加权的方法综合考虑用户人口统计学特征、用户话题特征和用户评分来进行用户之间相似度的计算。若用户为新用户,通过用户人口统计学特征和话题特征对照库,确定该用户的话题特征,并根据Jaccard系数进行相似度的计算。最终,系统为目标用户产生推荐。 本文采用MovieLens数据集作为算法实验的数据,通过对比传统协同过滤算法与本文提出的算法平均绝对误差来进行算法准确度的检验。实验结果表明本文提出的算法在一定程度上提高了协同过滤算法的精确度,并改善了算法的冷启动问题,从而提高了推荐的质量和系统的性能。