结合项目标签与评分的协同过滤推荐算法研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:js_wjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,用户可以从网上得到的信息呈现几何级增长。互联网改变了人们的生活,带来了诸多便利,同时也造成了一些负面影响。“信息过载”就是其中之一。“信息过载”指的是用户很难从海量的信息中快速准确的找到自己所需要的信息。针对信息过载问题,目前有两种技术手段去解决。第一种就是以搜索引擎为代表的信息搜索技术,另外一种就是以推荐系统为代表的信息过滤技术。二者的区别在于,搜索引擎需要用户有明确的需求,得到信息质量的好坏很大程度取决于用户对信息描述的精准程度。而推荐系统则不同,它是根据用户的历史行为和数据去挖掘用户的兴趣和需求,可以从海量的信息中筛选出用户感兴趣的信息。在用户对自己需求不是十分明确的时候,推荐系统的作用就显得更加重要,更能满足用户的个性化需求。推荐系统的核心是推荐算法。目前,已经有很多推荐算法被提出,协同过滤便是诸多推荐算法中,应用的最多且最为有效的。虽然协同过滤推荐算法在实际商业推荐中得到了广泛应用,但是仍然存在诸如数据稀疏性,冷启动等问题。本文提出了一种结合项目标签与评分的协同过滤推荐算法,其核心在于对项目相似性度量方法进行改进,提高推荐的准确性,使得推荐的物品更具有个性化,缓解遇到数据稀疏性问题推荐不佳的情况。主要工作包括:针对传统基于项目的协同过滤推荐算法中存在推荐准确性不高,数据稀疏性问题。提出了新的项目相似性度量方法TPSSI。一方面引入了标签信息,通过项目的标签信息计算项目之间的相似度,克服了仅用项目评分信息计算相似度的不足之处。另一方面充分考虑评分相似性和结构相似性,针对原有项目相似性度量方法,在利用用户-项目评分信息计算项目相似度时,会因数据稀疏性问题,导致计算的项目相似度结果不准确的情况,改用PSSI相似性度量方法计算项目之间相似度,使得推荐更精准。本文利用Movie Lens公开数据集进行实验验证,并将本文提出的改进算法与传统基于余弦相关性的项目协同过滤算法和基于皮尔逊相关性的的项目协同过滤算法进行对比,实验结果表明,本文提出的算法能有效的提高推荐的准确性,并在一定程度上缓解因数据稀疏性问题导致推荐不佳的情况。
其他文献
基于符号有向图(SDG)的故障诊断具有良好的完备性、易于解释性。但是其不足为分辨率差,因此,提出了基于模糊概率SDG模型和贝叶斯推理相结合的半定量故障诊断方法,将节点变量表示
生猪养殖是我国养殖业的重点项目,本文主要针对生猪养殖实际情况从养殖模式以及防疫检疫两个方面探索生猪养殖中疫病综合防控的思路,为养殖产业发展做出积极贡献。1生猪养殖
<正> 9942379 氟伏沙明反应中得出的情感性障碍的遗传模式/Serretti A∥Acta Psychiatr Scand.-1998,98(6).-443~450 北精情 9942380 根据国际疾病分类法第10版对感情障碍的诊
采用常压室温等离子体(Atmospheric and room temperature plasma,ARTP)诱变苏云金芽孢杆菌Bt-NBIC-380菌株,选育对亚洲玉米螟高毒力突变株。经过4轮的ARTP诱变、镜检及摇瓶发
目的探讨脑脊液B淋巴细胞活化因子(BAFF)、血管内皮生长因子(VEGF)水平在视神经脊髓炎(NMO)患者中的变化及其意义。方法选取2015年1月-2018年1月本院收治的NMO患者50例作为NM
畜牧业在我国农业经济中占有较大比例,对农业经济的发展起积极推进作用。但我国畜牧业高速发展过程中存在诸多问题,制约畜牧经济增长效率,不利于畜牧经济的可持续发展。为促
依据1985-2003年地下水质监测数据,分析了近20年西安城区潜水污染的时空变化.结果显示:在监测的23种污染物中,总固体、硬度和硝酸盐超标率较高,氟化物、氯化物、六价铬居中,
目的:分析在胆囊结石患者治疗中腹腔镜胆囊切除术的效果。方法:挑选在2018年4月-2019年4月间40例在我院进行手术治疗的胆囊结石患者进行临床研究,以抽签法为分组方式将患者进
佛教由丝绸之路传入中国,在新疆克孜尔等地石窟寺留下了丰富的、以菱格画为主的佛教壁画艺术。随着佛教东传,这种菱格形式的故事画发生了演变,敦煌莫高窟的连环形式故事画是
APF(Active Power Filter,有源电力滤波器)是一种抑制谐波和补偿无功的新型电力电子装置,它可对大小和频率都变化的谐波和无功进行补偿。SHAPF(Shunt Hybrid Active Power Fi