论文部分内容阅读
随着科学技术的发展,互联网已经成为人们获取信息的主要来源,互联网产生的数据正在飞速增长,使得用户很难找到自己迫切需要的信息。如何从“信息海洋中”迅速找寻到用户关注的兴趣点,是当前研究者关注的一个热点。推荐算法利用用户评分数据来计算用户或项目间的匹配度,从而达到推送目的。但推荐系统仍然存在用户评分数据稀疏、冷启动和预测准确性等问题,同时伴随着用户兴趣随时间而变化的挑战。本文针对这些挑战进行研究和分析,在考虑用户兴趣漂移和多角度刻画用户偏好的基础上,提出融合时间函数与用户属性的推荐算法,提高了推荐的准确性和多样性。本文的主要贡献点如下:1.针对用户数据评分矩阵的稀疏性的问题,提出了矩阵分解模型来进行降维和填充,对稀疏矩阵进行填充得到了新的用户评分矩阵,为后面算法的输入提供数据基础。2.针对用户兴趣随时间变化的问题,依据遗忘曲线拟合出时间函数,来表征用户兴趣变化规律。不同时间赋予了预测评分的权重,并融合到用户相似度的计算中,从而提高用户评分的有效性。3.针对推荐过程中的冷启动和预测准确性问题,引入用户属性来多样化刻画用户的特征,对性别、年龄、职业、地区四种属性进行了离散化,构建用户属性矩阵,计算出用户属性相似度,并对用户评分与用户属性相似度进行线性加权得到新的综合相似度,根据综合相似度计算出最近邻居集合,对目标用户进行推送,从而提高了推荐系统的推送质量。最后,本文对提出的融合时间函数与用户属性推荐算法,在MovieLens据集上从两个数据集上进行了相关实验。一方面是参数设置对矩阵分解填充算法和本文模型的影响实验,另一方面是本文提出的融合时间函数与用户属性的推荐算法对比其它算法的有效性和优越性进行了对比实验。实验结果表明,在矩阵分解填充算法中,当用户和项目的正则化系数分别取50和10,隐因子个数取175,用户评分和用户属性相似度的权重分别取0.7和0.3时,模型的整体性能最佳。另外,当最近邻数目选择30的时候,各算法的预测精确精确度最高,本文提出的的融合时间函数与用户属性的推荐算法与SC-CF、NCF和SS-MF推荐算法相比,分别提高了12.04%、10.15%、2.85%。