基于协同过滤的推荐算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：pengqiuyu1990

【摘要】

：

W.eb2.0技术将互联网带入了一个崭新的时代,互联网用户在互联网生活中发挥着越来越主动的作用,用户不再只是被动地从互联网上接受信息,而是主动地创造信息,并利用Web2.0平台

【作者】

：

刘青文

【出处】

：

中国科学技术大学

【发表日期】

：

2013年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

W.eb2.0技术将互联网带入了一个崭新的时代,互联网用户在互联网生活中发挥着越来越主动的作用,用户不再只是被动地从互联网上接受信息,而是主动地创造信息,并利用Web2.0平台与其他用户进行交互和分享。随着互联网用户的飞速增长,以用户为中心的信息生产模式造成了互联网信息的爆炸式增长,人们正面临着越来越严重的“信息过载”问题。“信息过载”问题是指,人们无法从海量的信息中快速准确的定位到自己所需要的信息。目前,解决信息过载问题的技术主要分两类,第一类是以搜索引擎为代表的信息检索技术,第二类是以推荐系统为代表的信息过滤技术。两者最重要的区别在于用户通过搜索引擎获取的信息的质量的好坏在很大程度上依赖于用户对于信息求描述的准确程度,而推荐系统不需要用户提供明确的需求,而是从用户的历史行为和数据中出发,建立相关的模型从而挖掘出用户的需求和兴趣,从而以此为依据从海量的信息中为用户筛选出用户感兴趣的信息。由此可见,在用户需求不明确时,推荐系统的作用显得尤为重要。到目前为止,已经有许多推荐算法被提出,协同过滤是这些算法中应用最多且最为有效的推荐算法。虽然协同过滤算法已经被成功地应用到许多商业推荐系统中,但是仍然存在着诸如数据稀疏问题、冷启动问题等亟待解决。随着互联网的飞速发展,以微博为代表的各种社交媒体纷纷涌现,以用户为中心的社交网站产生了海量的和用户兴趣相关的数据,如何有效的利用这些数据来改进推荐算法的性能已经成为一个重要的研究领域。针对以上关键问题,本文展开了如下几个方面的研究。第一,协同过滤中相似度模型的研究。用户(项目)相似度计算是基于内存的协同过滤算法中最为关键的问题,正负标注信息不对称和数据稀疏性导致了传统的相似度模型不准确从而影响推荐精度。本文针对这两个问题,提出了基于变权重和罚函数的用户相似度模型。实验结果表明,本文提出的算法能够有效缓解上述两个问题,从而提高推荐精度。第二,融合社交网络信息的协同过滤算法研究。丰富的社交网络信息给推荐系统带来的新的机遇也提出了更大的挑战,如何有效地挖掘海量的社交网络信息以提高推荐算法的精度是社交网络推荐系统研究的核心问题。本文基于腾讯微博用户的真实社交网络信息,构建有效的用户相似度模型,并将该相似度模型与基于评价矩阵信息的用户相似度模型相结合,提出了融合社交网络信息的协同过滤算法。实验结果表明,通过融合社交网络信息,数据稀疏问题得到了明显缓解且推荐精度显著提高。第三,基于用户与基于项目的融合协同过滤算法的研究。根据不同的假设,协同算法可以分为基于用户的方法与基于项目的方法。本文研究了两种方法在推荐性能与效果上的本质差别,并在此基础上针对两种方法的优缺点进行模型融合,提出了融合基于用户和基于项目的融合协同过滤算法。实验结果表明,基于用户的方法更擅长于热门推荐而基于项目的方法更擅长于长尾推荐,本文提出的模型融合算法能有效的缓解数据稀疏问题并提高算法精度。第四,协同过滤算法中的全局模型融合与局部模型融合研究。目前存在着许多有效的协同过滤算法(例如基于内存的方法与基于模型的方法、基于用户的方法与基于项目的方法),不同的算都具有各自的优势和缺陷。本文提出了不同的方法对于不同的用户(项目)的适用程度不一致的观点。基于上述观点,本文通过机器学习的方法,自动发现用户(项目)对于各种方法的适应程度,并进行局部模型融合。实验结果表明,局部融合模型比全局融合模型具有更高的推荐精度。

其他文献

盆底功能障碍性疾病的多因素分析

盆底功能障碍性疾病(pelvic floor dysfunction,PFD)是一种因盆底支持结缔组织薄弱引起的盆底器官解剖结构及位置改变造成的疾病,包括盆腔脏器脱垂、压力性尿失禁和生殖道瘘,

学位

盆底功能障碍性疾病危险因素白带常规乳酸杆菌

莲房提取物对2型糖尿病大鼠胰岛素抵抗的影响

目的观察莲房提取物(NRE)对2型糖尿病大鼠胰岛素抵抗(IR)的影响。方法 SD大鼠喂以高脂饲料4周后一次性ip给予小剂量链脲佐菌素(STZ,30 mg/kg),建立2型糖尿病大鼠模型。NRE低

期刊

莲房糖尿病胰岛素抵抗血脂抗氧化

创新服务理念优化护理流程

通过优化护理服务流程,强化服务意识,改善服务质量,提高服务效率,体会诊疗服务的过程中服务者与服务对象之间的一种关怀和尊重。开展优化护理服务流程,使护理人员感受以人为

期刊

创新理念护理优化流程

谈古代汉语多义词学习与掌握的实现

古代汉语多义词学习与掌握的实现是指如何去学习与掌握古代汉语中的多义词。具体说来应把握词义的系统性、词义的内在联系性、词义引申的规律性、抓本义的关键性、注意语境的

期刊

古代汉语多义词学习与掌握

食品业上市公司社会责任会计信息披露的研究

近年来,随着人们的生活水平的逐渐提高,食品的健康问题越来越得到人们的重视。从前几年苏丹红添加剂,再到三鹿奶粉、瘦肉精、地沟油等事故,这一系列事件背后的食品问题,引起

学位

食品行业社会责任会计信息披露研究

无彩色系颜色及其在对比中的变化

<正> 按照色彩学的分类,红、橙、黄、绿、青、蓝、紫……属于有彩色系颜色;黑、白、灰属于无彩色系颜色。无彩色系颜色在丝绸美术,特别是在丝绸印花设计中,起着不容忽视的重

期刊

无彩色系有彩色系

小学高年级语文课外阅读指导课教学研究

新课标强调“提倡少做题,多读书,好读书,读好书,读整本的书。关注学生通过多种媒介的阅读,鼓励学生自主选择优秀的阅读教材。加强对课外阅读的指导,开展各种课外阅读活动,创

学位

小学高年级课外阅读研究方法组织教学教学内容教学评价

凉血清肺散联合米诺环素治疗玫瑰痤疮的临床疗效

目的探讨凉血清肺散联合米诺霉素治疗玫瑰痤疮的临床疗效。方法 2014年5月至2015年4月重庆市中医院皮肤科收治的玫瑰痤疮患者92例,按随机数字法将其分为对照组(44例)和观察组

期刊

玫瑰痤疮凉血清肺散米诺霉素

黄连解毒汤的药动学-药效学相关性研究

目的研究大鼠给予黄连解毒汤(HJD)、黄芩提取物及黄芩苷后,血清中黄芩苷和汉黄芩苷的经时变化及抗氧化作用的药动学-药效学(PK-PD)相关性。方法以HPLC法同步监测血清黄芩苷、

期刊

黄连解毒汤黄芩黄芩苷汉黄芩苷药动学药效学

P2P借贷平台的信息安全风险分析

P2P借贷作为一种典型的互联网金融创新模式,确实解决了小微企业的融资需求,在我国发展普惠金融的大背景下,确实有着较大的市场空间,被许多人所看好。但是,P2P借贷平台的风险

期刊

P2P借贷信息安全风险控制机制

基于协同过滤的推荐算法研究

其他学术论文