论文部分内容阅读
随着互联网技术的广泛应用,人们被海量信息淹没,从而很难有效的找到自己所需要的内容,面临着信息过载带来的诸多问题。在电影视频网站中此类问题尤其明显,人们很难快速找到自己可能感兴趣的电影信息,并在寻找电影的过程中耗费了大量的精力。推荐系统技术通过直接向用户推送可能感兴趣的内容解决了该问题,并弥补了搜索引擎的不足,该技术正在受到越来越多学者以及工业界的关注。首先,介绍了协同过滤算法的核心理论及其实现,其主要分为基于邻域的协同过滤和基于模型的协同过滤。基于邻域的协同过滤主要通过评分矩阵计算相似度,再通过邻居集预测评分形成推荐,但是矩阵稀疏性、用户兴趣变化、冷启动是该技术很难解决的问题。基于模型的协同过滤,如聚类模型、贝叶斯网络模型等通过机器学习的方法解决了以上部分问题,并得到了更好的预测准确性,但同时也存在自身的不足。其次,介绍了奇异值分解的原理与方法,并针对其需要存储空间大、效率低等问题,引出了基于梯度下降的隐语义模型。此后在原始隐语义模型模型中加入了偏置项,并通过实验与原始隐语义模型进行了RMSE的比较。从多角度将隐语义模型与基于邻域的协同过滤的特点与局限性进行了对比。然后,提出了一种改进的k近邻模型,针对相似度单一问题,提出基于信息熵的项目属性相似度与原始余弦相似度进行线性加权融合。针对不同用户兴趣变化的问题,以艾宾浩斯记忆曲线为理论基础,设计出一个兴趣衰减权重,并将用户按年龄分组设置衰减系数,从而强化近期行为对推荐结果的影响。利用改进的k近邻模型对biasedSVD隐语义模型进行误差修正,实现两种模型的有效融合。通过在movielens数据集上进行试验对比,我们发现改进融合模型拥有较高的预测准确性。最后,应用了改进的融合算法开发了基于B/S架构的电影推荐系统,该系统应用JSP以及Servlet技术实现了个性化推荐、热门电影推荐、用户打分、电影管理等基础功能,达到了针对不同用户个性化推荐的目标,证实了算法的实用性。