论文部分内容阅读
互联网的普及和信息技术的快速发展,造成网络资源呈指数级增长,加剧信息过载问题。推荐系统是解决该问题的最有效工具,其中推荐算法为推荐系统的核心。协同过滤为目前应用最为广泛的推荐算法之一,它通过计算用户之间兴趣偏好的相似性,从而向目标用户推荐近邻所喜好的物品。然而,协同过滤算法在现实应用中存在数据稀疏性问题,随着推荐系统中用户和项目数量的迅速增加,这些问题会变得越来越严峻,为了缓解稀疏性问题对协同过滤算法的影响,本文展开如下研究:(1)针对传统相似度计算方法在数据稀疏情况下不能很好地度量用户之间的相似度问题,本文提出一种融合用户评分差异度的加权相似度算法(WDPCC算法)。该算法考虑用户之间的共同评分项目数及评分差异尺度对相似度计算带来的影响,在原有相似度计算方法的基础上引入相关权重因子及修正因子,对相似度进行修正,同时将该算法应用于协同过滤,通过与传统的相似度算法进行对比,实验结果表明本文提出的相似度改进算法能够有效缓解传统相似度计算不准确问题,并且显著提高了推荐系统的推荐质量。(2)针对推荐算法中用户兴趣标签信息过少问题,本文提出一种基于半监督学习的协同推荐算法(SSLCF算法)。该算法首先根据用户、项目之间的近邻关系及用户对项目的评分信息构建异构信息网络,将改进的相似度算法计算出的相似度(用户对项目的兴趣程度)分别作为同构网络(异构网络)的权重,然后采用正则化框架判别未标记用户和项目的类别,最后根据目标用户的喜好类别进行预测评分。实验表明,在给出少量标签的情况下,可以有效解决标签过少问题并改进推荐算法的性能。本文实验采用MovieLens这一国际标准数据集,并采用平均绝对误差,均方根误差作为指标进行评估,实验结果表明本文所提出的方法具备良好的性能,有效提高推荐的准确率。