论文部分内容阅读
随着计算机的迅速发展和网络技术的更迭运行,互联网逐渐进入人们的日常生活,并完全改变了人们访问信息的方式方法。大量的网络信息确实能提供很多价值,但是大多数消费者会被各种各样的选择所困扰,并且这些庞大的信息容易产生“信息过载”的现象,不能被更有效地利用,还会使用户查找相关信息变得越来越难。这个时候推荐系统的地位就突出了,推荐系统(RS)已被证明是有效的电子商务工具,它提供个性化推荐的技术,能够帮助用户选择具有吸引力的产品。到目前为止,推荐系统已经成功在电子商务中找到了应用,例如书籍推荐在amazon.com,电影推荐在 Netflix.com,等等。在众多推荐技术中,协同过滤(CF)是RS中最广泛使用的也是设计最成功的方法,但目前还是存在一定的缺点,如数据稀疏性的问题还在困扰着推荐性能的精确度提升。因此,本文基于传统协同过滤推荐技术,对其出现的问题进行深入研究和分析,主要研究内容如下:(1)本文介绍了协同过滤算法的历史发展历程还有近些年的发展成果,还介绍了相关推荐技术,包括常见的几种推荐算法。分析了目前还存在于推荐系统的几个问题,在数据稀疏的问题基础上改进,提出基于用户评分差异性的信息熵计算方法,通过熵值完成用户间评分差异的比较。(2)为了改善推荐效果,本文提出了融合信息熵的Jaccard加权相似性计算方法,这个方法综合考虑了用户共同评价的项目数量以及用户之间评分的差异性,通过传统的协同过滤推荐算法Jaccard系数与基于信息熵的相似性算法进行线性加权,达到推荐的目的。(3)由于传统的协同过滤推荐算法Jaccard系数只考虑了用户的共同评分数量,而忽略了用户的活跃度对项目评分的影响,本文提出了融合用户活跃度的Jaccard相似度算法,并与基于信息熵的相似性算法进行线性加权,以此提高推荐精度。最后通过在MovieLens等公开数据集上的实验,来验证本文所提出的相似度计算方法是否有效,同时与传统的几个协同过滤推荐算法进行比较。实验的最终结果验证了算法是有效的,综合了共同评分项目、用户活跃性以及用户之间的差异性所得到的算法推荐结果更佳。