论文部分内容阅读
近年来Web2.0技术的发展,互联网应用在日常生活中越来越普及,网络搜索、网上购物等活动也变得越来越流行。但是网络中迅猛增长的数据量与种类繁多的信息资源同样造成了信息过载的问题,在此背景下推荐系统应运而生,可以帮助用户在互联网中更好地选择自己所需要的资源。与传统的信息搜索技术不同,推荐系统根据用户选择的历史记录产生智能推荐,实现了资源主动寻找用户的信息发现模式,因此推荐技术迅速成为了国内外的研究热点并被广泛应用于社交网络与商业网站中。推荐系统中最重要也是应用最广泛的推荐技术是协同过滤技术,协同过滤技术利用用户行为的相似性来产生推荐。目前学术界与商业应用领域研究的热点问题主要有三个:第一是用户-评分矩阵的稀疏性问题,用户购买或者给予评分的物品是有限的,因此用户与资源之间评价关系存在巨大的稀疏性,这使得推荐精度受到很大的影响;第二是新用户和新项目的冷启动问题,当新用户或新商品加入时会因缺少相关信息带来冷启动问题,基于项目的协同过滤算法虽然在冷启动问题的处理上优于基于用户的算法,但它缺乏对用户行为信息的深入研究,不能个性化地建立用户模型;第三是推荐的准确度。如何更准确地建立用户行为模型,把握用户的关注趋势,最后为用户提供最需要与最新颖的产品,依旧是目前研究的热点课题。针对上述问题,本文开展了以下研究工作:(1)提出一种时间权重的迭代模型,改进了基于项目的协同过滤推荐算法。传统的协同过滤算法主要采用两种方式处理用户选择记录:计算数据库中所有项目的相似度或只计算用户最近一段时间内选择的项目之间的相似度。前者不能权衡项目的重要性,增大了系统的计算量,后者则忽略了用户的长期兴趣,会因用户临时选择产生的干扰信息作为推荐的依据,这两种方法都没有考虑用户的兴趣随时间变化的特点。本文受记忆原理的启发,为数据库中的项目赋予不同的权重,并根据最新动态进行更新,从而区分出用户的长短期兴趣,捕捉用户最近的关注点并记住其一直感兴趣的资源,产生更个性化的推荐。(2)提出一种基于粗糙集与模糊集合理论的推荐策略,通过粗糙集理论对项目的属性标签集进行约简,并获取每一个用户的属性偏好规则,以矩阵的形式存储在推荐系统中,同时对系统中的项目资源按照模糊统计方法计算其对属性标签的隶属度,得到隶属度矩阵,将规则矩阵与隶属度矩阵进行合成运算,得到用户与项目资源的关系矩阵,也就是用户可能感兴趣的项目。系统根据此矩阵向用户产生推荐。最后在MovieLens数据集上对本文提出的推荐策略进行了验证与准确率的比对,验证了算法的有效性。