论文部分内容阅读
由于大数据时代的到来,网络信息资源呈爆炸式增长,不仅造成了用户很难找到有用的信息,而且加重了信息过载的现象,这种现象推动了推荐技术的发展。不难看出,推荐系统是改善上述问题的有效措施之一。到目前,协同过滤的推荐算法仍然是应用最多的推荐算法之一。协同过滤的推荐算法主要是先通过用户的相似度找到目标用户的近邻集,然后将近邻集中用户偏好的前n个项目推荐给对应的目标用户。虽然该技术在推荐系统中取得了很好的应用和成功,但是也存在一些问题,主要包括冷启动问题、数据稀疏性问题、时间因素问题和推荐精度问题。本文是以如何改善上述问题为中心展开的研究,主要分为两部分进行研究:首先,为了改善传统协同过滤推荐算法中存在的用户冷启动问题、数据稀疏性问题和时间因素问题,本文提出一种融合时间因素的用户偏好和距离加权的聚类算法,可以使推荐结果更加符合用户的爱好,从而提升用户的满意度。本文通过引入用户基本的客观特征来缓解用户冷启动问题;关于稀疏性问题的改善主要是通过引入项目类型特征,即将项目特征引入到用户-项目评分矩阵来得到小维数的用户-项目属性总评分矩阵;使用TF-IDF算法构建用户-项目属性偏好矩阵时也引入了项目特征,同时考虑用户兴趣随时间漂移对用户偏好的影响;基于上述的三个矩阵,计算加权后的欧氏距离,然后利用K-Means算法进行聚类,并在经过大量相关计算后进行推荐。其次,基于评级预测模型的推荐系统没有考虑时间背景、用户的不同类别行为等问题。过去的用户行为分析中主要考虑了用户的主观评分行为,并未同时考虑用户客观行为、基于时间的用户偏好行为以及当下流行元素的行为。因此在本文中,提出了一个新模型CNN-BP来预测用户的下一个观看行为。本文中先是使用了卷积神经网络CNN来对上述提到的四种行为序列进行分析,得到用户对于未观看项目的四种基本概率。然后使用逆向传播神经网络BP计算最终的概率,并选取最终概率高的前N项进行推荐。CNN-BP模型很好的解决了上述问题和推荐精度的问题。本文是以电影的推荐为例,在MovieLens数据集上进行了对比实验,实验结果证明了本文所提出来的算法具有更好的推荐质量和性能。