基于用户相似度的协同过滤推荐算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:m1598745
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展将人类带入了信息时代,海量的信息使得用户难以从其中快速定位所需要的具体信息,从而出现了“信息过载”现象。个性化推荐技术的出现将用户从浩瀚信息检索查找中解放出来,成为一种继搜索引擎之后获取信息的重要方式,它不需要用户具体描述个人的信息需求,在用户无明确需求时其作用尤为突出。个性化推荐作为处理信息过载的重要技术,已在电子商务和社交网络等领域取得了十分广泛的应用。协同过滤因其推荐效果良好,算法简单,能够处理复杂对象,成为个性化推荐中最成功和应用最广泛的技术。其通过获取用户的历史数据,分析并预测用户潜在的兴趣,由此推荐物品。然而,协同过滤算法在现实应用中存在数据稀疏性和推荐不准确的问题。针对该问题,本文展开如下的研究:第一,针对推荐不准确问题,提出了一种改进基于加权信息熵相似度算法。计算相似度是协同过滤推荐中最为重要的一步,传统相似度的算法面临相似度计算不准确等问题,在数据较为稀疏时计算出来的用户相似度也常常面临结果不符合现实的问题。本文所提出的相似度算法,通过对用户的原始评分数据进行处理,利用用户间的评分差值的信息熵来度量相似度,并简化算法,通过实验与传统相似度算法进行比较,实验结果表明本文所提算法更加符合现实,有效降低了推荐系统的MAE值,使推荐精度得到提升。第二,针对数据稀疏性问题,提出一种融合用户特征和项目属性的协同过滤算法。传统的相似度算法仅仅依靠单一的用户评分值产生推荐,在数据非常稀疏时将很难做出准确的推荐,甚至无法推荐。针对此问题,本文提出新的算法,通过在传统相似度算法上加权基于项目属性的相似度算法,并在进行推荐计算时融合用户的活跃度,通过实验与传统算法进行比较,实验结果表明该算法比传统算法具有更好的性能,在传统算法无法做出合理推荐时该方法仍然能够做出较高的推荐精度。本文实验所采用的测试数据为MovieLens数据集,实验表明,本文所提出的方法能降低预测结果的平均绝对误差,可以提高推荐准确度。
其他文献
近年来,低密度奇偶校验(Low Density Parity Check LDPC)码作为一种可以接近香农极限性能的纠错码技术,逐渐成为信道编码理论研究的热点,在无线通信、深空通信、光和磁记录等
近年来,伴随着人们对无线城市的期盼及对高速数据传输的需求,具有更高吞吐量的IEEE 802.11ac/ad标准随之产生。本文主要基于上述这两个标准,研究当WiFi节点中间节点发挥中继/
在过去的三十多年里,自动人脸识别技术得到了各个相关领域研究者的极大兴趣与广泛关注,跨越了众多研究领域,如:图像处理,计算机视觉,神经科学,统计学,模式识别等。随着技术的
随着科技的进步,无线定位技术得以飞速发展。其中,辐射源无源定位以其良好的隐蔽性和抗干扰能力,在航海、航空、航天和电子战等领域获得广泛应用,受到各国的高度重视。本文以
对于需要存储大量数据且保证随时随地处理用户请求的企业来讲,容灾备份、性能诊断和优化、安全分析等多方面的管理需求使企业在存储管理上的投入越来越高。企业需要寻求更有
随着虚拟现实技术、计算机图形学技术和计算机视觉技术的快速发展,三维虚拟人逐渐发展成为一门新兴的学科,并吸引了越来越多的人从事相关的研究。由于人类的面部表情和情感非
目前,本体的应用领域越来越多,应用本体的主要目的都是为了知识的共享和重用,即希望通过本体对信息的表达实现语义级的共享和重用,从而为智能代理提供交流工具。本体的推理技
随着现代电子、信息技术的迅速发展,在未来的信息化战争中要求各类侦察接收机必须要具有更宽的输入带宽、更高的分辨率及灵敏度、更强的抗干扰能力,同时能处理多个来波信号,
串行高级技术附加装置(SATA)作为新一代的硬盘接口总线,具有更高的数据传输速率:SATA1.0(1.5Gbit/s)、SATA2.0(3.0Gbit/s);采用原生命令队列(NCQ)机制提高了命令的执行效率;