面向数据稀疏的协同过滤推荐算法研究与优化

被引量 : 0次 | 上传用户:slientlamb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和电子商务应用的飞速发展,越来越多的信息和服务充斥网络,用户在享受电子商务带来方便、快捷的信息服务的同时,也经常会迷失在大量的商品信息空间中,随之产生了“信息过载”问题。因此,电子商务个性化推荐系统应运而生。电子商务个性化推荐系统就是根据用户个人的习惯和偏好等来向用户推荐信息、商品或服务的程序。在电子商务平台上,个性化推荐系统模拟销售人员的角色,为用户提供帮助,并向用户推荐其感兴趣的商品,帮助用户顺利地完成购物。推荐算法是推荐系统中的最关键的技术。目前,协同过滤推荐算法是推荐系统中应用最广泛和最成功的技术之一,主要包括基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。但是,随着电子商务规模的不断扩大,协同过滤推荐算法遇到了一些挑战,如数据稀疏性问题、可扩展问题、冷启动问题和时间因素问题等。本文对传统的协同过滤推荐算法进行了深入的研究,提出了一种改进思路,取得了一定的效果。本文的主要研究工作有:(1)对电子商务个性化推荐系统进行了深入研究,包括电子商务个性化推荐系统的发展历程、体系结构,并对推荐系统中使用的相关技术进行了详细的介绍,最后介绍了电子商务个性化推荐系统的作用。(2)对传统的协同过滤推荐算法进行了研究分析,包括基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。重点介绍了算法的实现步骤,并指出了传统协同过滤推荐算法存在的不足,同时也介绍了一些改进方法。(3)提出一种协同过滤推荐算法的改进方法,这也是本文的核心部分。针对数据稀疏性问题,将基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法的思想相结合,通过项目相似集来计算用户对未评分项目的预测评分,填充用户-项目评分矩阵,从而降低数据稀疏性。针对时间因素问题,在计算预测评分过程中引入时间函数,对评分时间近的评分赋予较大的权重,对评分时间远的评分赋予较小的权重,从而提高预测准确度。(4)进行仿真测试。使用Matlab软件实现改进算法,并利用Movielens数据集对算法进行测试,验证其合理性。本文首先比较了余弦相似性、相关相似性和修正的余弦相似性三种相似度计算方法,然后对改进的协同过滤推荐算法和传统的协同过滤推荐算法进行了对比实验。通过实验,证明改进算法取得了一定的效果,能够提高推荐质量。
其他文献
目的:了解近年农药中毒病例的特征及农药种类的变化,为农药急性中毒救治及预防提供参考数据. 方法:描述性分析急性农药中毒病例的时间地区分布、中毒原因、接触途径、年龄
驱动马达为小汽轮机的引风机与常规电动机驱动的引风机相比,其启动和并联具有特殊性。通过分析探讨可知,在引风机进口加补气门可保证单台引风机安全启动,在引风机进出口加烟
目的:通过分析2560例孕前医学检查的夫妇检查结果,探讨行孕前检查对优生优育的重要价值。方法:对笔者所在医院行孕前检查的1280对夫妇进行相关孕前检查,观察传染性疾病、泌尿生
红树林是分布于热带、亚热带河口潮间带的一种特殊的植物群落类型,对于浅海、滩涂栖息生物的多样性保护发挥着重要作用。随着工业化与城市化的加剧,工业三废和城市生活污水的排
经济的增长不单纯是总量的问题,更是结构变动的问题。结构能否有序、合理的变动直接影响经济增长的速度。自上世纪80年代以来,随着经济发展、农民收入开始增加。当收入增加到一
本研究旨在探讨一种复合植物提取物(植物提取物Ⅰ型)对猪生长性能和猪肉品质的影响。试验采用单因子实验设计,选用日龄相近,体重相当(约20kg)的杜洛克×长白x大白三元杂交健
当今全球气候的变化,影响着人类的生存与发展。气候环境变化也同样影响着林业有害生物的发生、发展规律,随着极端天气的不断出现,黑龙江省的林业有害生物随气候变暖而暴发成
目的探讨Menkes病的临床和实验室特点。方法对1家系2例确诊为Menkes病患儿的临床、实验室检查、影像学资料及基因表现进行回顾性分析。结果2例患儿均为男童,先证者生后4个月
乳腺癌是女性最常见的恶性肿瘤之一,在我国占全身各种肿瘤的7%~10%,并呈逐年上升趋势。目前,国内手术治疗乳腺癌的常用方法是乳腺癌改良根治术,由于手术范围广、创面大,导致部
随着计算机技术的发展,基于图像处理的人类精液辅助分析系统也逐渐成功用于临床试验,并且逐步替代传统的医生用肉眼观察计数,凭经验判断精子活力,无科学性的分析诊断,为现代生殖科