基于用户相似性的推荐算法优化研究与实现

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:zhuang321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。
其他文献
本文认为:"合力团"概念系由恩格斯的"合力"论延伸而来;它是一种客观存在;它是一种特殊的系统;它的变化有自己的特点;它的运动也有特殊性;它的生命建立在运动与联系两个基点上
龙门山飞来峰主要有挤压推覆和重力滑覆两种形成观点,飞来峰的成因对龙门山的构造演化具有重要意义。通过对其北段宝珠寺飞来峰野外实地考察及其构造变形特征的研究,得出该飞来
文章基于金融稳定的实质就是金融体系功能的正常、稳定发挥以及金融结构决定金融功能,阐述了金融稳定与金融功能、金融结构三者之间的联系。分析了当前不利于我国金融稳定的金