协同过滤推荐算法的设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tprgaefe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤技术是目前推荐系统中应用最为广泛和成功的技术之一,其基本思想是利用与目标用户兴趣相投、拥有共同经验群体的喜好来为目标用户推荐感兴趣的信息。协同过滤技术被广泛应用于电子商务、社交网络和学术信息查阅等Web2.0服务当中。如Amazon、Net-flix、e Bay等网站都采用协同过滤算法进行商品推荐。但是,传统的协同过滤存在诸如扩展性、稀疏性和冷启动等问题。随着电子商务的飞速发展,扩展性问题变得尤为突出,由于计算资源和速度的限制,当推荐系统的用户和项目增长到一定数目时,计算效率将大大降低,以至于无法满足用户的需求。如何解决推荐系统的可扩展性问题已然成为了一个巨大挑战。此外,推荐系统中每个用户所涉及的项目占系统项目总数量的比例非常小,因此用户对项目的评分数据是非常稀疏的,数据稀疏严重影响了系统的推荐准确性,如何解决推荐系统中数据稀疏问题也是当前推荐算法研究的热点。本文针对上述协同过滤技术存在的可扩展性问题和稀疏性问题,分别从用户聚类和用户项目间关系联合聚类两个方面进行研究改进,提出了如下两种算法:基于聚类模型和记忆的混合协同过滤推荐算法和基于用户和项目间关系联合聚类的协同过滤推荐算法。首先,针对可扩展性和推荐效率问题,本文将聚类算法引入到传统的协同过滤算法中,提出了一种基于聚类模型和记忆的混合协同过滤推荐算法。传统的协同过滤推荐系统面临可扩展性差的问题,随着如今互联网用户和项目数量的飞速增加这种缺点愈加明显,导致实际应用中实时推荐效率降低。基于聚类模型和记忆的混合协同过滤推荐算法通过离线聚类减少了搜索最近邻居集的搜索时间,从而节约了在线推荐的时间消耗,提高推荐效率,使系统的可扩展性大大提高。此外,针对目前协同过滤算法面临的数据稀疏性问题,提出了一种基于用户和项目间关系联合聚类的协同过滤推荐算法。算法通过融合用户-项目评分记录,用户-用户社交关系和项目间关联三种信息进行联合聚类建模,根据聚类模型实现多类别综合推荐,显著降低了数据稀疏带来的影响,提高了协同过滤推荐算法的推荐质量。
其他文献
和大部分发展中国家一样,我国目前也正在面临人口过剩、资源紧缺和环境污染等问题。长期以来形成的以牺牲资源环境来追求经济发展的模式导致人与自然关系逐渐失衡,人口、资源环境与经济三系统的协调发展问题,成为当前可持续发展研究的热点。西北地区相比中国其他地区自然环境较为严酷,地广人稀,且人口分布不均,经济发展比较落后。长期以来西北地区主要以资源型经济为主,粗放的生产经营模式使得当地原本脆弱的生态环境系统遭受
作为继“沪港通”后,内地与香港股票市场的又一重大制度设计,“深港通”政策一直备受关注。“深港通”政策经过两年多的平稳运行,互联互通机制的效果如何,是否达到管理层预期效果以及深港市场的回馈反应都值得深入研究。尤其在当下,从“沪港通”机制的不断优化、“沪伦通”的正式通航、QFII和RQFII总额度大幅提升、MSCI不断提高A股纳入比例到部分期货品种引入海外投资者,在中国资本市场开放力度持续加大的背景下
高温超导材料的发现大幅降低了超导技术应用的成本,而第二代高温超导带材的广泛商品化,将超导技术应用门槛进一步降低。虽然,横截面积相等的高温超导带材载流能力远胜于常规导体,但单根高温超导带材往往不能满足实际工程应用的载流能力需求。于是,学者研制出一系列以CORC导体(Conductor On Round Core)、TSTC导体(Twisted Stacked-Tape Conductor)、QIS导
Web2.0的出现改变了传统的信息传播和共享方式,导致了互联网上用户产生和发布的数据呈爆炸式增长。微博是Web2.0时代最受欢迎的网络社交平台之一,由于其具有书写简单、接入方
无线传感器网络(Wireless Sensor Networks,WSN)是通过无线通信协议把部署在一定区域内的大量传感器节点连接在一起的自组织网络系统。目前传感器网络节点一般采用电池供电,
近年来,表面织构作为可有效减摩的方式受到了相关学者广泛的关注与研究,但大多研究都针对于平行织构表面,对客观存在的织构化非平行表面的研究比较少。为了探讨织构化非平行表面的摩擦学性能,本论文以非平行油膜间隙为研究对象,考虑空化效应的影响,基于FLUENT软件分别对流体润滑条件下空化效应对摩擦学性能的影响,收敛比参数的合理性,以及全织构和局部织构表面的摩擦学特性进行了研究,并探讨了基于局部织构的径向滑动
随着社会经济快速发展,大都市急促的工作生活节奏和环境生态疏离,使得人们的身心压力不断增大,游客对生态环境和精神生活的需求层次越来越高。同时,全面小康社会的建设成就,产生了大量的中高收入人群,而且闲暇休假的时间也在增加,大中城市周边的乡镇中高端旅游创新发展的条件日趋成熟。以康养旅游为产业的特色小镇越来越被旅游者所喜欢。广东梅州留隍镇地处广州、深圳、珠海等高度发达的大中型城市周边,濒临韩江流域中游,踞
东莞市重大科技专项自2009年设立以来,年均支持预算约6000万元,年均带动社会资本投入项目研发1.41亿元,带动项目单位完成项目产业化收益约8900万元,对产业共性技术攻关突破、人才聚集、社会经济发展起到了明显推动作用,但从单位资金撬动社会资本、科技成果产出、产业化收入情况看,远低于同地区风投和股权投资产生的效益比,约30%的项目存在进展不顺需延期或无法进行终止的情况,并始终面临与产业界实际技术
基于文本库的自然语言问答(DBQA)任务是指,给定以自然语言形式出现的问题,在每个问题对应的候选文本库中找到并返回最相关的答案。其特点在于文本库中是非结构化的信息,并且
随着高速铁路运营速度的提高,列车负荷不断增大且高速运行时持续取流,高速铁路牵引供电系统对沿线平行敷设的电力电缆产生的电磁干扰愈发明显。为了研究高速铁路牵引供电系统对平行电缆的电磁干扰机理,分析处于不同区段时的影响因素和规律,找到降低平行电缆电磁干扰的防护措施。本文将与高速铁路平行的电力电缆作为研究对象,从电磁耦合理论、不同区段电磁干扰因素及特性、工程防护措施等方面展开研究,具体工作总结如下:首先,