论文部分内容阅读
互联网的飞速发展伴随着互联网信息的海量增长,用户需要根据自身特点准确地组织协调信息,因此个性化推荐技术应运而生。其中协同过滤推荐算法是个性化推荐技术中最为成熟的算法之一。论文对协同过滤算法进行深入研究,对与传统的协同过滤算法提出一些改进方案,目的在于探究提高传统算法的推荐精度以及缓解传统算法存在的问题的方法。主要研究内容如下:(1)在传统的协同过滤推荐算法计算相似度的过程中加入用户特征因素和时间场景因素。首先从评分数据集的时间戳中提取小时数据,按照每天时间段划分数据集,然后利用划分后的数据集计算用户相似度,在计算相似度时利用历史评分数据的同时加入用户特征因素。加入用户特征因素可以缓解传统算法的冷启动和数据稀疏性问题,加入时间场景可以满足用户个性化需求。(2)在协同过滤推荐算法计算预测评分的过程中加入用户信任度因素。传统的协同过滤预测评分的计算方法是以用户相似度为权重的加权平均,论文在此基础之上,同时将用户信任度也作权重因素,其中以每个用户的评分数量作为其信任度,数量越多信任度越高。加入了用户信任度使预测评分更加精确。(3)加入用户特征因素的协同过滤采用的方法是计算相似度时利用历史评分数据的同时加入用户特征因素,两者是按照一定权值结合,合理的权值取值才能保证最优的推荐结果,通过对权值进行尝试实验来探究最佳权值的规律。(4)在Movielens数据集上对上述方案分别进行实验,实验结果表明论文研究的改进推荐算法比传统算法的推荐精度更高,并且对因素和权值的选取给出一些建议。