协同过滤推荐系统中的冷启动问题研究

被引量 : 0次 | 上传用户:mmyxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和电子商务的迅猛发展,人们在享受越来越多信息服务的同时也面临着信息过载问题所带来的困扰。如何在不断膨胀的资源中迅速、准确地找到适合用户的信息,满足用户的个性化需求,逐渐成为众多研究者和网络用户关注的热点问题。个性化推荐系统就是在这样的背景下应运而生。它最大的优势在于能够快捷,准确地定位用户真正需要的信息,缓解信息检索的压力。协同过滤推荐技术是推荐系统中应用最广泛和成功的推荐技术,但随着用户数量的急剧增长,协同过滤推荐算法面临着一些挑战。冷启动是推荐算法中尚未得到有效解决的一个关键问题。现有协同过滤算法主要通过分析与挖掘评分矩阵,找到与目标用户兴趣相似的最近邻,根据这些最近邻的建议得到推荐。然而系统无法对新用户、新项目进行有效推荐,因为它们缺乏足够的评分信息。由于推荐系统中一般都保存了用户和项目的内容信息,这启发我们结合内容信息对传统的协同过滤算法进行改进。本文的主要工作如下:(1)提出一个用于解决协同过滤推荐算法冷启动问题的算法框架。该框架首先利用用户-项目评分信息进行聚类、然后利用内容信息和聚类结果建立分类模型,借助分类模型对新用户新项目进行分类,最后结合传统的协同过滤技术产生推荐。所提算法框架克服了新用户新项目由于缺乏评分信息而无法找到相似邻居的不足。通过对算法框架的具体细化可以同时适用于解决新用户和新项目问题。(2)对所提算法框架进行改进和细化。针对用户评分矩阵非常稀疏,根据原始评分矩阵进行聚类得到的结果不具有代表性的问题,本文在聚类前对原始评分矩阵进行预填充,在填充后的评分矩阵上利用K-means算法进行聚类。而K-means算法中聚类效果受初始点选择影响,对初始点选择进行了优化,选择评分个数较多,所有评分均误差最小的用户或项目作为初始聚类中心点。利用改进后的所提算法分别对新用户和新项目问题进行了有效的解决。最后,本文通过实验对所提算法进行评估,并与传统的协同过滤算法和现有解决冷启动问题常用算法进行相比较,实验结果证实了本文提出的算法在解决冷启动问题上的可行性、正确性和有效性。
其他文献
荧光免疫检测技术在现实生活中应用日益广泛,遍及环境污染物监测、医学检验、食品检验等诸多领域,发展迅速。本研究所涉及的生物素-链霉亲和素系统(BSA)是具有灵敏度高、特异
政府作为我国社会经济社会发展的规划与领导部门,肩负着重大的历史责任和人民的重托。如何统筹规划,迎接挑战,推进社会与经济又快又好的发展成为中国各级政府组织面临的首要
绩效审计作为一种政府经济控制手段,以经济性、效率性、效果性为原则,来强化政府的经济责任,促进经济增长、劳动就业等目标的实现,以及资源的合理配置和有效利用,实现经济、
近几年来,随着Internet和分布式对象技术的飞速发展,分布式应用(例如,网格计算,云计算,P2P系统等等)无论是在研究领域,工业领域,或是商业领域都变得越来越普遍。这种分布式系
工业企业搬迁遗留场地变更为居住、商业等用地,其土壤污染物类型、种类繁多,且因地而异。本文对某地块土壤中镍污染现状进行了初步调查检测,检测结果表明该地块土壤受到镍的
<正>当前,绿色公路建设面临诸多制约,如内涵特征不统一、推进方案不具体、管理机制不健全等。本文从管理政策、技术标准、评估指标和管理办法四个维度,提出绿色公路管理体系
芳香聚酰胺由于其优异的热性能和机械性能而被称作高性能有机材料。在过去的几十年中,汽车、航空航天和微电子工业对这种耐热性材料的需求不断增长以代替金属和陶瓷。其热稳
冠心病是21世纪威胁人类健康的最主要疾病之一,根据其症状表现,现代中医学者多把其归于"胸痹""真心痛"等范畴。本病的发生发展与气机失调有关,从气机失调论治,调畅气机,对冠心病
锂硫电池由于其较高的比容量和能量密度成为新一代可循环高能电池的一个重要选择。粘结剂是硫基复合正极中一个重要的组分,极大地影响着电极的电化学性能。本次研究主要探索
本文立足于大力培育当代革命军人核心价值观的现实需要和有效履行新世纪新阶段我军历史使命的根本任务,就当代革命军人荣誉观的培育问题作了多方探索。通过对西方国家军人荣