基于改进融合模型的电影推荐系统的研究与实现

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:hzj123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的广泛应用,人们被海量信息淹没,从而很难有效的找到自己所需要的内容,面临着信息过载带来的诸多问题。在电影视频网站中此类问题尤其明显,人们很难快速找到自己可能感兴趣的电影信息,并在寻找电影的过程中耗费了大量的精力。推荐系统技术通过直接向用户推送可能感兴趣的内容解决了该问题,并弥补了搜索引擎的不足,该技术正在受到越来越多学者以及工业界的关注。首先,介绍了协同过滤算法的核心理论及其实现,其主要分为基于邻域的协同过滤和基于模型的协同过滤。基于邻域的协同过滤主要通过评分矩阵计算相似度,再通过邻居集预测评分形成推荐,但是矩阵稀疏性、用户兴趣变化、冷启动是该技术很难解决的问题。基于模型的协同过滤,如聚类模型、贝叶斯网络模型等通过机器学习的方法解决了以上部分问题,并得到了更好的预测准确性,但同时也存在自身的不足。其次,介绍了奇异值分解的原理与方法,并针对其需要存储空间大、效率低等问题,引出了基于梯度下降的隐语义模型。此后在原始隐语义模型模型中加入了偏置项,并通过实验与原始隐语义模型进行了RMSE的比较。从多角度将隐语义模型与基于邻域的协同过滤的特点与局限性进行了对比。然后,提出了一种改进的k近邻模型,针对相似度单一问题,提出基于信息熵的项目属性相似度与原始余弦相似度进行线性加权融合。针对不同用户兴趣变化的问题,以艾宾浩斯记忆曲线为理论基础,设计出一个兴趣衰减权重,并将用户按年龄分组设置衰减系数,从而强化近期行为对推荐结果的影响。利用改进的k近邻模型对biasedSVD隐语义模型进行误差修正,实现两种模型的有效融合。通过在movielens数据集上进行试验对比,我们发现改进融合模型拥有较高的预测准确性。最后,应用了改进的融合算法开发了基于B/S架构的电影推荐系统,该系统应用JSP以及Servlet技术实现了个性化推荐、热门电影推荐、用户打分、电影管理等基础功能,达到了针对不同用户个性化推荐的目标,证实了算法的实用性。
其他文献
河流化学径流多源自流域岩石风化、地表侵蚀及人类活动等,水化学特征是流域多重环境信息的综合表现。为探讨丹江口水库水化学特征及影响因素,分别于2017年10月、2018年1月、4
随着现代社会的不断发展、人们的生活水平得到显著提高、各地高层建筑物显著增加、建筑工程在生活中有着很重要的意义、根据本人多年的工作经验、结合相关的理论分析、立足于
以《大学英语课程教学要求》和需求分析为理论基础,对招聘单位、毕业生、在校生和老师进行问卷和访谈。结果显示,社会、学生和教师都对完成大学英语教学任务后开设后续课程有
伴随社会的发展过程中人员流动的频繁与加快,辽宁竞技体育人才流失问题已经对全省竞技体育水平产生了负面影响。面对现实,我们尝试从理论、政策建设与实践层面理清思路,对不
根据全国企业兼并破产和职工再就业工作领导小组及财政部的有关文件精神,经清算组研究决定,对1999年1月至2003年6月30日期间在昆明威世实业有限责任公司工作,且于宣告破产前离开
如何防止建筑物开裂破坏和整体滑动等质量问题的发生,是工程所关注的,因此必须重视地基的变形和稳定问题。对软弱地基处理,消除软弱地基对上部建筑物的不利影响,处理的优劣,将关系
为了根据来水情形确定年度用水总量控制指标并对水量分配过程进行合理控制,提出了面向总量控制的水量动态优化分配方法。以抚河流域为研究对象,构建了以流域余留期缺水量最小