协同过滤系统中推荐算法与推荐策略研究

被引量 : 6次 | 上传用户:love4898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来Web2.0技术的发展,互联网应用在日常生活中越来越普及,网络搜索、网上购物等活动也变得越来越流行。但是网络中迅猛增长的数据量与种类繁多的信息资源同样造成了信息过载的问题,在此背景下推荐系统应运而生,可以帮助用户在互联网中更好地选择自己所需要的资源。与传统的信息搜索技术不同,推荐系统根据用户选择的历史记录产生智能推荐,实现了资源主动寻找用户的信息发现模式,因此推荐技术迅速成为了国内外的研究热点并被广泛应用于社交网络与商业网站中。推荐系统中最重要也是应用最广泛的推荐技术是协同过滤技术,协同过滤技术利用用户行为的相似性来产生推荐。目前学术界与商业应用领域研究的热点问题主要有三个:第一是用户-评分矩阵的稀疏性问题,用户购买或者给予评分的物品是有限的,因此用户与资源之间评价关系存在巨大的稀疏性,这使得推荐精度受到很大的影响;第二是新用户和新项目的冷启动问题,当新用户或新商品加入时会因缺少相关信息带来冷启动问题,基于项目的协同过滤算法虽然在冷启动问题的处理上优于基于用户的算法,但它缺乏对用户行为信息的深入研究,不能个性化地建立用户模型;第三是推荐的准确度。如何更准确地建立用户行为模型,把握用户的关注趋势,最后为用户提供最需要与最新颖的产品,依旧是目前研究的热点课题。针对上述问题,本文开展了以下研究工作:(1)提出一种时间权重的迭代模型,改进了基于项目的协同过滤推荐算法。传统的协同过滤算法主要采用两种方式处理用户选择记录:计算数据库中所有项目的相似度或只计算用户最近一段时间内选择的项目之间的相似度。前者不能权衡项目的重要性,增大了系统的计算量,后者则忽略了用户的长期兴趣,会因用户临时选择产生的干扰信息作为推荐的依据,这两种方法都没有考虑用户的兴趣随时间变化的特点。本文受记忆原理的启发,为数据库中的项目赋予不同的权重,并根据最新动态进行更新,从而区分出用户的长短期兴趣,捕捉用户最近的关注点并记住其一直感兴趣的资源,产生更个性化的推荐。(2)提出一种基于粗糙集与模糊集合理论的推荐策略,通过粗糙集理论对项目的属性标签集进行约简,并获取每一个用户的属性偏好规则,以矩阵的形式存储在推荐系统中,同时对系统中的项目资源按照模糊统计方法计算其对属性标签的隶属度,得到隶属度矩阵,将规则矩阵与隶属度矩阵进行合成运算,得到用户与项目资源的关系矩阵,也就是用户可能感兴趣的项目。系统根据此矩阵向用户产生推荐。最后在MovieLens数据集上对本文提出的推荐策略进行了验证与准确率的比对,验证了算法的有效性。
其他文献
首先阐述超短激光脉冲发展的几个历史阶段及其特点 ,并介绍了飞秒激光器的类型及飞秒脉冲的产生、放大与测量 ,最后介绍了飞秒激光技术的相关学科。
<正>【裁判要旨】在房屋强拆案件中,对因行政机关过错导致原告无法证明具体实施主体的,应降低原告的证明责任。对合法建筑的拆除,首先应推定为行政强制行为,除非有证据足以推
民事诉讼法修正案确立了公益诉讼制度。这也让行政诉讼法的修订行政公益诉讼制度的的确立看到了希望的曙光。实际上,由检察机关提起行政公益诉讼,不仅理论基础深厚:其一,当事
随着5G网络建设的开展,更加精准的5G定位必将成为5G业务和应用的催化剂,中兴通讯5G定位产品iLBS已经做好商用准备,为国家安全、智慧城市、工业物联网插上腾飞的翅膀。在2G/3G
在一篇经典文章中,Imbs and Wacziarg(2003)提出在经济发展的过程中,产业集中度服从一个U型模式,先多元化再专业化。通过对1995年中国工业普查和2004年中国经济普查结果的仔
作为当代西方后现代主义文化研究的一大热门话题,互文性理论强调特定文本与其他相关文本之间的相互影响、相互影响、相互关系,是理解一切文本的前提。该理论多被运用在文学研
以安徽省皖南山区宣城市宣州区为代表,运用统计学方法、地统计学方法和GIS技术研究了农田表层(0~20 cm)土壤有机碳(SOC)含量的空间分布及其影响因子。统计结果表明:研究区SOC
证券场外交易市场是多层次资本市场中的重要组成部分,而其信息披露制度体系的构建对于证券场外交易市场的法律监管有重要意义。本文以法学角度出发,从市场视角与国家视角二者中
大数据,人工智能以及云计算受到了各行各业的关注,各个行业都在探索大数据、人工智能以及云计算的应用方式和方法,也取得了不错的成绩,但是对三者的融合应用,依然未达到预期