基于项目的协同过滤算法的改进

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:kenching
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的飞速发展,信息的规模呈爆炸式增长。人们在享受丰富的信息资源同时,也面临着难以快速的从海量信息资源中寻找出自己需要的信息的困扰。为了帮助人们快速高效地从海量信息中找到符合自己需求的信息,推荐系统应运而生。推荐系统是一种重要的信息过滤工具,它可以在用户不显示表达自己信息需求的情境下,根据用户以往浏览网页时留下的评分和评论等历史行为数据,主动向用户提供信息推送服务。推荐系统的核心构件是推荐算法,目前使用最为成功的推荐算法是协同过滤算法,然而,该算法目前仍然面临着诸多的挑战,如使用的评分矩阵的稀疏性问题,算法的可扩展性问题,推荐结果的实时性问题等。在协同过滤算法中,基于项目的协同过滤算法一般会表现出相对更好的性能,因此本文也是基于该算法展开的研究。基于项目的协同过滤算法运行过程中,最关键的步骤就是项目近邻集合的搜索。由于算法运行过程中所使用的用户-项目评分矩阵异常稀疏,导致项目近邻搜索的准确性一直受到很大的限制,尽管目前也有很多现有项目相似度计算模型已经能够较好缓解由于近邻搜索的不准确问题而造成的推荐不准确问题,但是仍然有一些没有考虑到的因素。本文基于对现有的一些相似度计算模型进行深入研究分析的基础上,提出一种新的综合项目相似度计算模型,然后再通过引入聚类思想,对传统的协同过滤算法进行改进,从而在保证近邻搜索准确度的情况下加快近邻的搜索过程。在建立的新的项目相似度计算模型时,本文综合考虑了用户的相似喜好信息、共同评分信息、项目平均得分的差异性信息和以及用户评分的敷衍性等因素,从而提出了本文的JAVWeightedModel;由于JAVWeightedModel项目综合相似度模型计算的时间复杂度较高,本文为了加快近邻的搜寻的过程,又引入了K-Center聚类算法,并将JAVWeightedModel模型融入到K-Center聚类过程中,最后使用改进后的K-Center算法对协同过滤算法进行改进,从而在尽可能保证项目近邻搜索准确度的前提下,进一步提高近邻的搜索速度。最后通过在不同规模的MovieLens数据集上来验证本文中的方法的有效性和正确性。
其他文献
随着我国海运事业不断的发展,各港航企业、海事机关等对船舶监管的任务日渐繁重,CCTV、VTS、AIS、VHF等系统被广泛用于船舶交通安全及船舶污染防治的监督管理,但这些系统相对
数字水印是一门保护数字产品版权的信息安全技术。随着互联网技术的发展,数据库在网络上的应用更加广泛,数据库的版权保护越来越受到学术界和商业界的关注,因此将数字水印技术运
互联网给人们带来了很大的便利,基于互联网的数据互访是技术基础。SUN公司提出的RMI(远程方法调用)对数据访问提供了一层逻辑封装,随后CORBA的出现,SUN公司推出了EJB(企业级java
在过去几年,随着互联网的快速发展,Web已真正成为多数公司的一个获取信息和宣传的渠道,并且影响力越来越大(比起其他的信息渠道,如电话销售、广告等等)。于是从Web站点上获取用户的
随着电信行业竞争的不断加剧,电信运营商开始将目光从传统的客户关系管理转向一种新的经营管理理念——客户体验管理(CEM)。客户体验管理的核心理念是,通过给用户提供设定的
随着硬件技术的发展,无线传感器网络得到了越来越广泛的应用。但是开放的网络环境、动态的拓扑结构以及有限的能量和带宽,使无线传感器网络面临巨大的安全挑战。恶意节点能够
皮肤听声是一种解决聋人听声问题的新技术,其实质是通过声.电转换后使皮肤获得对电流信号的感应且第一代产品已经问世,但由于目前研制的皮肤听声器在信号处理上的弱点较为明显,
在信息检索领域中,信息检索系统的评估工作一直以来对检索技术的研究、发展和应用有着巨大的影响。从上个世纪六十年代开始,测试集成为评估工作的主要形式,其构建的质量直接
随着社会的发展,信息无障碍的研究与发展受到人们越来越多的重视,其中一个很重要的技术就是手语识别和手语合成技术,这种技术的发展为聋人和正常人之间的自然交流提供了一个很好
网格是继Internet和Web之后的第三代互联网应用,其目标是将互联网上计算资源、存储资源、通信资源、软件资源、信息资源和知识资源等所有资源全面整合在一起,通过高速互联网