基于项目综合相似度的协同过滤算法

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:luowencheng7758258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网拥有全世界最全最大的信息资源,丰富的资源给人们的生活和学习带来了便利的同时,也引发了信息过载的问题。如何让没有明确目标的用户能准确找到满意的信息资源,成为目前信息生产者所面临的问题之一。推荐系统的出现可以解决这个问题,推荐系统的关键是推荐算法。本文要构建个性化电影推荐系统,常用的基于内容的推荐算法不适合电影信息的特征提取,电影系统也不存在好友关系,社交网络推荐也不适合电影系统推荐,所以该系统使用协同过滤推荐。随着个性化电影推荐系统的推广用户会越来越多,电影每年增长的数量没有用户多,所以基于项目的协同过滤算法显然更适合基于用户的协同过滤方法。传统的基于项目的协同过滤算法只考虑了用户评分矩阵,没有考虑到项目类别矩阵,所以推荐质量不高。本文在相似度计算方面改进了基于项目的协同过滤算法,主要工作如下:1)提出了综合相似度是项目与项目间的相似度和项目类别间的相似度以一定权重组合在一起。传统的综合相似度计算,项目与项目之间的相似度的系数和项目类别间的相似度的系数和为1,并不能很好的解释能够组合的理由。本文改进了权重的配比方式,对于组合方式有很好的解释。平均绝对误差MAE是评判推荐算法优劣的一种标准,通过比较传统算法和改进算法的MAE,来验证传统算法和改进算法的优劣。2)推荐算法计算复杂,自然而然花费的时间也多,利用Hadoop技术可以对基于项目综合相似度计算和Top-N推荐并行化。通过时间上的提高率证明了并行化计算减少了时间复杂度,提高了用户体验效果。
其他文献
随着社会信息化程度的提高,分布式技术以及网络技术在社会的多个领域都得到了充分的利用。然而客户自身需求日渐多样化,竞争也逐渐加剧。因此对管理信息系统自身的重用性、灵活
随着网络技术的发展,可扩展标记语言XML得到了极大的进步。与超文本标记语言HTML不同,XML实现了文档数据内容与显示的分离,具有很强的自我描述能力、可扩展性好等特点,从而有利于
虚拟化技术已经成为现代数据中心通常采用的抽象技术。通过把硬件资源多路复用划分为多个虚拟机(VMs,virtual machines),从而实现多个操作系统同时运行在相同的物理平台,它可以有
虚拟接口体系结构是一种用来彻底提高与延迟相关的网络操作性能而设计的通信协议.它通过提供一个高速率的机群通信接口,将一个强大的技术带给客户/服务器计算环境.虚拟接口体
移动通信已经迈入了3G时代,WCDMA作为3G的三个标准中最早,最完善的标准为3G运营商所广泛选用。目前我国也即将发放3G牌照,因此WCDMA网管系统的开发具有很强的现实意义。在网
随着计算机技术的快速发展,应用领域迅速扩大,软件规模及复杂性的不断提高,软件危机愈加明显地暴露出来,提高软件生产率成为软件产业的当务之急。软件复用是软件工程的重要领域,被
基于图像序列跟踪目标的运动是计算机视觉的基本问题之一,它在图像及影片的重建、视频监控、医学图像分析及运动重建方面,都有广泛应用。在该领域常用的方法有利用Kalman滤波
本论文分析了良好的物流数据交换技术对于当今企业发展的重要性。总结了国内外数据交换技术发展的现状。并构建了基于XML的物流数据交换中心。主要工作涉及以下几个方面: 1
随着Internet的飞速发展和普及,Web应用呈现出多功能化发展趋势,同时对Web应用框架支持多界面性、可扩展性、易维护性提出越来越高的要求。然而,目前面向过程的Web应用技术很难
基于混沌的数字图像加密算法中,序列流式加密算法是主流研究方向。目前的算法生成的密文只与生成的密码序列值相关,是由一个密钥决定的从明文空间到密文空间的可逆变换,虽然