协同过滤推荐算法的研究与应用

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:hamjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的应用和普及,特别是电子商务的迅猛发展,存储在网络上的数据呈现出指数增长的趋势,由此出现了“信息爆炸”和“信息过载”的问题。推荐系统作为一种新兴的信息过滤技术,能够很好的解决上述问题,正越来越受到国内外科研学者的关注。协同过滤推荐系统是最早研究的推荐系统,它的基本思想是:兴趣相似的用户可能会购买相同的商品。协同过滤推荐系统可以根据历史购买记录分析用户的兴趣爱好,并通过兴趣相似的近邻提供推荐。现在,协同过滤推荐系统在许多领域获得了巨大成功,但仍然存在相似度计算准确度不高和数据稀疏性的问题。相似度计算准确度不高不仅会影响邻居用户的选择,还会给评分预测带来巨大的误差;评分数据的极度稀疏性也会造成推荐精度急剧下降。本文针对上述两个问题,提出了两种改进的协同过滤推荐算法。具体研究内容如下:1.基于权值的协同过滤推荐算法。用户的兴趣爱好主要通过其历史评分表现出来,但每个评分表现用户兴趣的能力是不同的,越是与众不同的评分越能体现用户某方面特殊的兴趣爱好。所以算法根据评分的个性化程度将评分矩阵分为个性化和大众化两部分,分别计算相似度,然后用加权和的方法计算总的相似度。于此同时,用户的影响力也有大有小,根据研究,那些对冷门项目评分越多的用户,其影响力越大。所以在计算用户间相似度时也引入了用户的影响因子作为修正。改进的相似度计算方法可以有效的提高推荐的准确度。2.分步预测的协同过滤推荐算法。合理安排未知评分的预测次序可以有效缓解数据的稀疏性。算法先对评分矩阵做预处理,重新排列矩阵元素的位置,使评分信息集中到矩阵左上角,并对评分个数过少的用户进行部分填充;然后再提取一个数据密度较高的子系统,用基于信任的算法填充其缺失值;最后通过不断往子系统里添加“新用户”、“新项目”的方法实现分步预测的目的。这种方法可以保证每次计算时都有较高的数据密度,可以很好的缓解数据稀疏性问题。
其他文献
由于航电系统结构复杂,数据传输和故障关联较多,故障诊断定位困难,准确性和效率难以保证,尤其是在航电多故障发生情况下,关联故障的传播给故障诊断带来了很大难度,所以航电多故障诊
近年来无线传感器网络(Wireless Sensor Network,WSN)技术不断发展,其应用范围也不断扩大。然而,传感器节点能量消耗的问题成了影响节点寿命和网络性能的关键因素。如果有传感器
在计算机视觉和智能视频监控领域,步态识别是一个新兴的研究方向,它是根据人们走路的方式来进行人的身份识别。本文主要是对步态识别中的几个关键技术进行研究,其中包括步态
CDMA系统是最为常见的伪噪声通信系统,CDMA系统中,每个用户被分配一个唯一的码序列,系统用该码序列对用户发送的信息符号进行扩频,并将所有扩频后的用户信号合并在同一个信道
随着现代科学技术的发展,医学图像处理对人们的生活变得不可或缺。医学是与人的健康密切相关的学科,重要性不言而喻。医学的CT、MRI图像是目前医生诊断疾病的主要依据。然而,