基于类别和矩阵填充的协同过滤算法研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wsadzjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0、移动互联网和电子商务等技术的飞速发展在给人们带来便利的同时,也带来了信息过载问题,因为网络资源呈现出爆炸式地增长。如何解决信息过载问题是当前人们面临的一个重要问题,采用推荐系统是一种能有效解决这个问题的方式。推荐系统的质量在很大程度上取决于其所采用的推荐算法,协同过滤算法是目前最成功和应用最广的算法之一。然而,协同过滤推荐算法也面临着稀疏性和可拓展性等问题,随着推荐系统中用户和项目数量的迅速增加,这些问题会变得越来越严峻。为了缓解稀疏性问题对协同过滤算法的影响,本文从两个方面对协同推荐算法进行了改进。具体工作如下:首先,评分数据稀疏性会严重影响相似性计算的准确度,本文提出一种基于类别的协同过滤算法,该算法通过构造用户-类别矩阵实现降维,能有效缓解稀疏性。针对YueWu提出的用户-类别矩阵元素计算方法的不足,提出一种改进的计算方法,提高了相似度计算的准确度,从而获取更准确的用户兴趣近邻。其次,当邻居用户对目标项目无评分时,可以采用一些预测填充算法进行填充,Slope One算法因具有原理简单、易于更新和运算效率高等特性,而被广泛用于对评分的预测填充,能有效地解决稀疏性这一问题,但是该算法在预测的精度上表现的不是很好,因为Slope One算法忽略了用户的评分尺度差异这一重要因素,对此,本文提出一种改进的Slope One算法对用户评分尺度差异这一因素进行了处理,提高了预测评分的准确度。最后本文将改进的用户-类别矩阵计算方法和改进的Slope One算法相结合,提出一种基于类别和评分矩阵预测填充的协同过滤推荐算法。为了验证所提算法的效果,本文通过在MovieLens中的ml-100k数据集上进行多组对比实验,与传统的基于用户的协同过滤算法、基于原始的Slope One填充的推荐算法进行对比,采用平均绝对误差和均方根误差等作为评测指标,实验结果表明本文提出的两个改进点都有效地提高了协同过滤算法的精确度,此外,也验证了本文提出的推荐算法算法具有良好的推荐性能,能有效缓解稀疏性造成的影响。本文最后对全文进行了总结,并对后续工作进行了展望。
其他文献
提出了用布拉格相移光纤光栅中相移来实现低功率的光标交换的新方法.设计了一个基于该方法的光标记交换实验.实验所用的布拉格光纤光栅是在通信用的标准光纤内刻写而成,通过
习近平总书记在治国理政的实践中多次阐述了实现国家富强、民族振兴、人民幸福的"中国梦"。"中国梦"由梦想变为现实、由理论变为实践需要各地域群众的支持和地域精神的助推。
CTI技术集成了电话的通信功能和计算机的信息处理功能,可以在传统通信线路上与其他交换设施配合实现呼叫控制、综合消息处理以及回叫等业务,在电力系统调度通信中已获得广泛
<正>那日正逢周末,我们正在闲聊天。小院忽然热闹了,呼啦啦涌进来一群小朋友,打破了山里的沉寂。原来是幼儿园组织了两日"单飞"活动,孩子们手拉着手去山间探险,去村里遛羊、
<正> 过敏性鼻炎是耳鼻喉科常见的疾病,治疗方法繁多而效果尚不够满意。1976年初开始,我们应用斑螯粉贴敷穴位治疗过敏性鼻炎124例,初步小结如下。一、临床资料:本组124例,男
为防治油菜重要病害根肿病,研制15%氟啶胺包衣悬浮剂,以甘蓝型油菜品种中双9号为材料的试验结果表明:按包衣比[包衣剂质量(g)∶种子质量(g)]≥1∶50包衣油菜种子,15%氟啶胺包