基于记忆网络的个性化推荐方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:lbx5000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和信息技术的飞速发展,人们已经身处于一个信息爆炸的时代。一方面人们感受到了科技发展所带来的前所未有的方便与便捷,另一方面也使得信息过载成为互联网时代的一大挑战。信息资源的急剧增加,使得用户想在纷繁复杂的网络资源中找到自己所需的内容变得十分困难。个性化推荐可以有效地缓解上述所存在的“信息过载”状况,让用户得到符合自身偏好的服务,以提升用户体验,因而具有重要的研究价值。近年来,越来越多的研究者将深度学习技术应用于基于隐式反馈的协同过滤推荐领域。然而,传统的深度学习模型通常利用记忆能力有限的隐藏状态或权重来充当记忆功能,无法存储长期信息,因而难以执行记忆操作。例如,将用户的所有历史交互记录嵌入到单个隐藏状态向量中,这将无法捕获单个用户历史交互记录与用户偏好之间的相关性。记忆网络能够存储长期信息,并能执行记忆操作,因此我们考虑设计记忆网络来充当记忆功能。此外,传统的深度学习模型一般都是直接刻画用户和项目,而忽略了用户邻域和项目邻域中含有的协同信息的重要性。用户邻域指的是访问过同一个项目的所有用户组成的用户集合,同一个用户邻域中的用户们互为邻居;同理,项目邻域是指同一个用户访问过的所有项目构成的项目集合,同一个项目邻域中的项目们互为邻居。我们猜想邻域中含有的协同信息能够在一定程度上提升推荐的性能。为此,本文基于记忆网络展开了对个性化推荐方法的研究。通过设计记忆网络作为记忆功能,同时考虑邻域之间的协同信息,来提高推荐的准确性。本文主要内容如下:(1)本文提出了一种基于项目邻域的协同记忆网络模型。该模型首先设计了记忆网络并结合注意力机制构造出项目邻域组件,以此来存储项目的长期信息。接着通过项目邻域记忆网络来捕获目标项目与其邻居之间的关系,经过多层项目邻域组件的迭代处理,达到对高阶的项目邻域信息的长期记忆。最后联合用户和项目记忆与项目邻域信息来编码复杂的用户-项目关系,并得到预测分数。在三个真实数据集上,本文通过与最先进的协同过滤方法以及基于深度学习的模型进行对照,验证了该模型在HR@5、HR@10、NDCG@5和NDCG@10等评测指标上的优越性。(2)本文以(1)中提出的模型为基础,进一步提出了邻域注意协同记忆网络模型。为了学习用户与其用户邻域中邻居之间潜在的相似性,该模型又设计了用户邻域组件,用于存储用户的长期信息。接着通过关联寻址方案来编码目标用户与其邻居之间的关系,再堆叠多层用户邻域记忆网络得到更深层次的结构,进一步挖掘更高阶的用户邻域信息。最后输出模块通过融合用户和项目记忆与用户和项目邻域信息得到排序分数。实验结果表明相比于最先进的基准方法以及(1)中提出的模型,本模型有着一定的性能提升,验证了模型的有效性。此外,本文还分析了该模型的参数敏感性,并通过消融实验探究了单个邻域记忆网络组件对模型的影响。
其他文献
图像分类技术在生产生活中有着广泛的应用。然而,在许多应用场景中,需要对外观十分相似的类别进行分类,传统的图像分类技术难以满足这一需求,因此细粒度图像分类就成了图像分类领域一个重要的研究方向。细粒度图像分类也有广泛的应用场景,比如自然保护区的生物识别、无人超市的商品识别、交通路口的车辆识别等,但是由于“类内差异大,类间差异小”等问题,细粒度图像分类仍然是一个具有挑战性的任务,尚无法满足实际应用的需求
黑客或恶意攻击者通过各种方法入侵网络,导致网络环境面临着大量具有针对性、隐蔽性和渗透性的潜在威胁,网络安全面临着严峻的挑战。入侵检测系统(Intrusion Detection System,IDS)作为安全防御系统被用来检测网络环境是否存在入侵行为,并针对各种入侵行为产生相应的报警数据,便于安全管理人员采取相应的防御措施,然而IDS在实际应用中会产生大量冗余、错误的报警,使得管理人员难以从中找到
视频中人体行为的自动识别是指从原始视频数据中自动识别出对应的人类动作。人体行为识别是进行视频语义理解、视频结构化描述的关键技术。相较于视频中的车辆的识别,人体行为由于其行为种类多,就需要更准确地识别。而且,在获取的视频中,由于存在着各种客观因素,如视频的画面抖动、复杂背景、视角变化等。对此,现有的人体视频行为识别算法对于以上这些问题的处理仍然受限。本文通过利用时空信息融合,分析视频中的关键人体行为
随着移动互联网的普及,以及在线教育的人数突破新高,越来越多的问题文本数据被上传至互联网中。网络中存在大量的未标注问题数据,对于用户的选择造成了困扰,用户很难从中分辨出问题的难度。为了使得用户能够更好地选择自己适合的问题难度,节省用户筛选问题的时间,帮助用户进行个性化学习,对于问题难度的预测变成一个亟待解决的问题。问题难度预测是教育数据挖掘领域中重要的问题之一。现有的问题难度预测模型基于专业人员对问
随着云计算与容器技术的高速发展和深度结合,给互联网行业带来了重要的技术革新,同时“智慧旅游”概念的提出,推动着传统旅游行业的进步与革新,随之诞生了大量的以“互联网+旅游”为背景的互联网产品和应用。本文研究基于模糊多属性决策,面向智慧旅游系统,主要的研究工作如下:(1)提出了一组基于q阶正交模糊数的Dombi幂分区Heronian平均算子。首先,介绍了基于Dombi T-范数和S-范数(DTT)的q
分组密码作为一种主流的加密手段,有着易于商业标准化、适用性强、密钥信息不需要同步、扩散性良好等优点,在各种安全设备中得到了广泛的应用。未受保护的密码算法在密码设备中运行时很容易遭受到侧信道的攻击,从而威胁到密码设备的安全性。如何提高现有侧信道攻击的效率和针对攻击做出相应的防护是目前国内外研究的热点和难点。本文基于国际主流密码算法AES和国密算法SM4的算法结构,研究相关功耗分析的优化方法;并研究了
深度学习算法在图像分类等许多应用场景中取得令人瞩目的成绩。但是,研究表明含有恶意扰动的对抗样本可以欺骗甚至操纵这些复杂神经网络模型,从而使得它们输出错误的预测结果。为了应对这种威胁,本文重点研究对抗训练和预处理防御这两种提高神经网络模型鲁棒性的方法。对抗训练,即使用对抗样本训练神经网络模型,是一种有效的防御措施。经过对抗训练的神经网络模型往往具有很强的抵御对抗样本攻击的能力,但是在训练过程中生成对
文字作为体现一个国家和民族文化的载体,其重要性不言而喻。通过使用计算机识别真实场景中的文字已经成为计算机视觉领域最重要的研究内容之一。然而现有的场景文字检测与识别算法大都针对于英文、中文等使用人数广泛的语言文字。越南文字作为一种声调语言表音文字,使用人数相对较少但具有代表性。与常见的拉丁文字不同,越南文字的书写中存在6种声调符号标记,使用不同的声调符号表达不同的语义信息,现有算法在检测与识别越南场
随着物联网的快速发展,越来越多的物联网设备接入网络,使得传感设备能够更方便的收集数据。数据采集是数据分析的前提。数据收集工作的缺乏将导致数据分析工作流于形式。因此,数据收集工作是实现大数据分析的关键步骤。然而,很多数据涉及到用户(数据提供者)的个人隐私,用户并不想提供这一部分的数据。例如,用户的身体指标数据(血压、心率等),这部分作为用户隐私被用户保护。这将导致数据收集工作的质量大打折扣。所以,隐
由于智能手机定位功能的普遍应用和数据地图的可访问性,基于位置的服务(LBSs)如雨后春笋般迅猛发展,并且已经成为了一种新的服务模式。在过去的几年里,我们目睹了基于位置的服务的广泛推广。许多LBSs相关产品应运而生。人们可以从软件平台下载许多关联应用,包括导航、社交、游戏等,来享受LBSs提供的一系列丰富的个性化服务。虽然LBSs服务便捷和市场规模广阔,但是它也引发了高度的安全担忧。例如,攻击者能够