混合记忆曲线与关联规则的标签推荐算法

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:deadhorse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展、数据的海量增长,应用系统中的用户和资源数据变得十分庞大,用户并不容易寻找所需信息。标签具有表示用户偏好、标注资源特征的功能。用户可以使用标签搜索、过滤、管理以及标注资源。准确地向用户提供其感兴趣的标签,可以提高用户对系统的使用体验,增加用户对系统的黏着度。  影响标签推荐准确度的因素主要有两个方面。其一,兴趣漂移现象。用户的偏好会随着时间推移、环境变化而发生兴趣漂移,影响系统挖掘用户偏好。另一方面,数据稀疏问题。在大规模的系统中,用户和资源的数据量十分庞大,会造成不同用户之间存在交集的概率下降,导致数据稀疏问题,影响标签推荐的质量。  为了解决上述两个问题,论文提出了相应的解决方案。  首先,针对兴趣漂移问题,论文提出基于记忆曲线的标签推荐算法。为了更加准确地刻画用户偏好、及时发现用户兴趣变化,该算法以记忆曲线规律为原理,对协同过滤进行了改进。  其次,针对数据稀疏现象,论文提出基于关联规则的标签推荐算法。此算法设计了一种重叠滑动时间窗口。利用这种时间窗口采集标签数据,挖掘标签之间的关联规则,然后根据关联规则进行标签推荐。  最后,为了提高标签推荐的质量,论文提出混合记忆曲线与关联规则的标签推荐算法。此算法以加权平均的方式将上述两种标签推荐算法混合在一起,并且利用粒子群算法寻找最优的加权参数。  实验结果表明,基于记忆曲线的标签推荐,可以较准确刻画用户偏好,提高推荐准确度;基于关联规则的标签推荐能够在一定程度上缓解数据稀疏问题,提高推荐质量;混合记忆曲线与关联规则的标签推荐算法能够有效综合上述两种方法,提高推荐准确度。
其他文献
企业网中,各分支机构内部网络的规划与实现和局域网技术的发展是密切相关的。此网络设计方案中采用了虚拟网技术(VLAN)。虚拟网络把交换机组成的网络在逻辑上分割成若干个广播
Web 2.0时代最显著的特点就是以用户为中心,更加注重用户的交互作用,微博就是Web 2.0时代以来出现的代表技术之一,其简单的发布流程和随意的表达方式,让用户能自由地参与网络
网格在90年代中期被提出来以后,得到了迅速的发展,被称为“因特网的第三次革命”。网格数据库是数据网格的重要组成部分,而事务提交协议又是数据库中事务处理的重要组成部分
无线传感器网络(WSN:Wireless Sensor Network)集计算、通信、传感等技术于一身,具有节点受限、自组织性、面向应用、以数据为中心等特点,广泛的应用于军事、交通、医疗等多
自1991年美国Echelon公司开发出LonWorks技术以来,以其开放性和互操作性以及系统完整性好等优点,在楼宇自动化、工业自动化等领域获得广泛应用,已经被ANSI(美国国家标准协会)
人脸识别在基于生物特征识别技术的身份认证中是最主要的方法之一。基于人脸识别的自动身份认证具有重要的理论意义和应用价值,早在六七十年代就引起了研究者的强烈兴趣,对人脸
随着微电子技术、嵌入式技术、网络及无线通信技术的发展使得传感器不再是单个的感知单元,而是成为能够交换信息、协调控制的有机结合体。无线传感器网络综合智能传感器技术
在开放式的网络中开展商务、政务、网上办公等活动对网络的安全性提出了更高的要求,其中关键的安全性要求包括:参与活动各方的身份认证、会话的机密性、会话的完整性和不可否认