基于标签聚类和兴趣划分的个性化推荐算法研究

来源 :安徽理工大学 | 被引量 : 5次 | 上传用户:lonlychanging
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,大量信息出现在人们的视野中。信息爆炸使人们能更方便地接收多方面的信息。但与此同时,有价值信息的快速获取也变得更加困难。为了解决这种情况,人们通常在获取信息时先对其进行检索和过滤。搜索引擎作为信息检索技术的代表可以很好地帮助人们从海量的信息中检索出有用的信息。但当搜索的关键词不能恰当的反应出搜索需求时,查询的结果就会令人失望。而个性化推荐作为信息过滤中典型的应用正好可以弥补这方面的不足。目前主流的推荐算法包括基于内容的推荐、协同过滤推荐、基于规则的推荐、混合推荐等。在这些推荐算法中,协同过滤技术是实际应用中最为广泛的推荐技术。它根据产品评分和相似性算法选出与目标用户有着相似兴趣偏好的用户集合,再从这些相似用户评价高的产品中选出那些目标用户尚未评价过的产品推荐给用户。但传统的协同过滤没有考虑到标签对推荐结果的影响,只根据用户对资源的评分单方面挖掘用户兴趣,未能对用户兴趣进行有效划分,同时也忽略了用户兴趣随着时间推移发生的变化。为了解决以上问题,本文进行了如下研究:1.针对传统的协同过滤忽略了用户喜好因时间推移而发生的改变,本文提出了一种融合时间因子的协同过滤推荐算法。该算法考虑了产品评分时间和不同时段产品受关注的程度对用户兴趣偏好的影响,分别建立了时间遗忘模型和时间窗口模型,并把这两种模型融合,生成时间因子。之后,在用户相似度的计算中通过时间因子对产品评分进行时间上的过滤,从而能够更加准确地计算出目标用户的相似用户,减小因时间因素造成的推荐质量的下降。实验表明该法能有效地适应用户兴趣变化,提高智能Web系统在推荐中的准确率。2.考虑到用户与标签之间的关系,本文提出了一种基于标签聚类和兴趣划分的协同过滤推荐算法。该算法考虑了标签和用户评分对推荐结果的影响,通过标签聚类划分用户兴趣,并分别在标签和产品评分上对目标用户的相似用户进行选择。同时,在计算标签和产品评分权重时融入了时间因子,以适应用户的兴趣变化。实验部分,在Movielens数据集上通过交叉验证和与其它推荐算法的对比说明了该算法能有效的划分用户兴趣,减少时间因素对推荐质量的影响,提高推荐的准确度。
其他文献
随着移动互联网的飞速发展,电子商务数据出现爆炸式增长,人们面临着越来越严重的"信息过载"问题。"信息过载"是指人们无法从海量的数据中快速准确的定位到自己所需要的信息,
下一代的电力系统称之为智能电网(Smart Grid,SG)。先进的网络通信技术可以实现SG经济、快速的数据传输,但智能电网通信网络(Smart GridCommunication Networks,SGCN)仍然面临着
基于稀缺标记样本的半监督学习作为传统半监督学习的一个重要领域,主要研究当样本集中标记样本与未标记样本数量存在严重不平衡性时,如何获得优秀的鲁棒分类器的问题。区别于一
丰富互联网应用(Rich Internet Applications)是一种新型Web技术,它能够为互联网的用户带来丰富的体验。RIA目前已经成为Web技术领域研究的热点,深深地影响了Web应用。RIA为
电力绝缘子泄漏电流是表征绝缘子运行状态的重要数据,能够科学地表征绝缘子绝缘水平。但为了分析其高频特性,采样数据量需要很大,其庞大的采集数据量给数据通信和存储造成了严重的负担。数据压缩方法能够有效减小数据量,降低传输带宽要求。根据现有数据压缩方法,结合泄漏电流数据特征,提出了利用EMD(empirical mode decomposition)对数据进行分解,并用分形理论对泄漏电流数据进行压缩和恢复
随着网络技术的不断发展,远程监控系统在隧道监控方面的应用也越来越显现出它的优势,远程监测与控制、故障诊断、决策支持等功能为隧道交通的安全运营提供了有力手段和切实保
随着网络技术的发展与进步,网络时代的人工之智能对许多领域的发展起到了重要的作用。而移动Agent作为分布式人工智能技术与网络技术发展的必然结果,成为当前人工智能研究的热
面向对象的状态转移给软件性能造成的影响历来是测试领域研究的重点。本文在论证UML状态图能够通过描述状态而发现软件性能问题的基础上,提出了一种基于UML状态图的性能测试
在线考试系统中对于主观编程题通常采用动态评阅方式:编译并执行预先设置的测试用例,根据运行结果与用例预期输出是否一致评阅程序。动态评阅方式在程序无法编译的情况下不能
随着我国高速公路事业迅速发展,公路景观漫游系统对公路规划、设计和评价起着非常重要的作用。然而,目前的公路景观漫游系统在场景实时动态交互性和场景管理方面存在不足,为