基于信任关系的社交推荐算法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xiaobaitu11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的高速发展,网络上的数据得到爆炸式增长,呈现种类繁多、结构复杂等特点,传统推荐算法逐渐不能有效解决信息过载的问题。伴随各类社交应用的涌现,融合社交信息的推荐技术开始成为学术界和工业界的研究重点。社交推荐算法在评分数据的基础上引入了用户社交网络的信任信息,可以有效缓解数据稀疏和冷启动问题。但是,大多数社交推荐算法仅对用户自身的购买偏好建模,忽略了用户信任朋友的偏好信息,且没有充分挖掘用户信息在社交网络上的传递性。社交推荐算法的关键在于如何利用信任网络挖掘深层次的用户及其朋友的偏好信息以及交互关系。因此,本文针对基于信任关系的社交推荐算法的研究,主要做了以下工作:(1)针对传统社交推荐算法没有有效利用信任关系挖掘用户朋友偏好信息的问题,本文提出了一种融合信任关系和用户多偏好的图记忆网络模型(PA-GMN)。首先利用注意力机制在用户隐向量学习中融合用户不同评分级别的偏好信息,其次使用记忆网络存储用户及其朋友的多类共有偏好,并利用图神经网络建模社交网络中用户信任关系及偏好信息的传递性,最后利用模型训练得到的用户隐向量和物品隐向量进行评分预测。对比实验中,该模型在现有的开源数据集上相较其他社交推荐算法可以有效提升预测准确度,结果表明,PA-GMN算法可以有效缓解数据稀疏和冷启动问题,提高推荐系统的性能。(2)针对PA-GMN算法无法区分用户及朋友的多类共有偏好对评分预测物品的影响程度,本文又提出了一种改进的基于自注意力机制的融合多偏好的图注意力网络模型PA-GAN。该模型主要使用了自注意力机制捕获朋友多类偏好信息对预测评分物品的不同影响,并利用用户在社交网络的信任关系对融合了该偏好信息的朋友向量进行加权聚合得到最后的用户隐向量,最后使用模型训练得到的用户向量和物品向量进行评分预测。实验结果表明,相较其他社交推荐算法,本模型PA-GAN可以大幅度提升推荐准确性;相较PA-GMN算法,本模型在推荐性能上也有很高的提升。(3)在本文提出的融合信任关系和用户多偏好的PA-GMN和PA-GAN算法的基础上,设计并实现了一个社交推荐系统,该系统包括数据预处理模块,图拓扑构建模块,模型训练模块,数据存储模块以及用户推荐模块,主要负责对数据的处理流程、模型的运行流程以及推荐结果进行可视化展示。
其他文献
近年来,互联网技术快速发展,各类信息剧增,互联网上每天有海量信息在生成、传播和存储。作为人的标识之一的人名,在互联网检索中有非常重要的意义。但由于人口巨多,人名数量巨大,使得进行人物相关文章的搜索时,重名现象严重,搜索引擎不能达到预期的效果,返回的内容中包含大量噪声信息,需要用户去进一步的识别、筛选,这就使用户检索信息的难度大大增加。因此如何设计一个系统,能高效识别人物,消除人名歧义,节省用户搜索
随着工业互联网的发展,带来终端传感设备数量激增,传输与存储的数据呈现爆炸式增长,企业、机构通过数据挖掘能够进行一系列的分析、预测,但传感数据普遍存在数据质量高低不齐的现象,若直接使用,将造成信息的误判,经济、时间等损失。因此应找到一种合适的数据质量评估方法,对数据质量进行评估,让后续的分析、预测等操作有一个良好的数据质量保障。本文研究了数据质量评估的主流方法,重点分析了基于机器学习的数据质量评估法
票房作为衡量电影能否盈利的重要指标,受诸多因素共同作用影响且其影响机制较为复杂,电影票房的准确预测是比较有难度的。目前电影票房预测的研究存在依赖社会媒体舆论信息、影人价值量化方式单一、没有挖掘影人合作关系价值等不足。尤其如果要在电影上映前给出预测,基于社会媒体评论和舆论热度的票房预测方法难以应用。本文提出了一种基于 GBRT(Gradient Boosting Regression Tree)和关
飞机表面蒙皮伤痕是威胁飞行安全的一大主因,因此,航空公司在飞机转航停场期间对蒙皮伤痕进行检测是保障飞行安全的重要工作。目前较为先进的检测方法是基于计算机视觉的伤痕检测法,该方法将采集到的飞机蒙皮图像传输给伤痕检测服务,进行基于人工神经网络的图像处理以识别伤痕类型及位置信息,从而判断蒙皮受损程度,保障飞行安全。由于检修飞机数量多、检修时间短,该方法在图像传输、处理过程中需要进行大量的数据传输和计算。
语音增强作为语音任务的前置预处理技术,在语音识别、语音分离等中得到了广泛的应用。语音增强主要是从含噪语音中去除掉噪声语音,恢复纯净语音。在过去的研究中,主要分为传统算法和基于深度学习的方法。传统的算法包含了许多假设,在低信噪比环境下会出现语音失真。现在基于深度学习的算法被证明效果要优于传统的算法。本文主要工作是提出了基于时域的语音增强算法。过去利用深度学习来进行语音增强时,往往工作在频域,需要将含
科学的体育运动能够改善人体的健康状况,对人们日常生活中的体育运动进行定量分析,能够有效避免不当运动带来的损伤及达到运动促进健康的最优效果。步行作为人们日常生活中最主要的运动方式,步态数据对于评价人体健康程度具有十分重要的研究价值。随着5G商用的逐步推进,物联网(Internet of Things,IOT)的快速发展带动了人们对体联网(Internet of Bodies,IOB)的探索,基于可穿
当今的许多大中型企业中总有数目繁多的科技项目亟待立项,这些待立项的科技项目常常会在特定的时期需要大量的相关行业专家来进行评审,然而这时仍沿用传统的人工遴选项目评审专家的方式,想在短时间内找出一批合适的项目评审专家无疑是十分困难的。对此本文以科技项目的评审专家遴选问题为研究背景,选用电力行业内真实的项目申报材料作为研究样例,应用自然语言处理模型预测出每篇科技项目与电力行业内相关研究领域之间的关联度,
源代码缺陷检测技术作为一种重要的软件测试技术,具有缺陷检测效率高、故障定位准确和自动化程度高等特性。然而人们在实际应用该技术的过程中,发现其检测结果存在警报量大、重复率高以及误报等问题,需要专业的技术人员投入大量时间对检测出来的缺陷进一步确认,这也就导致了人工确认效率低下的问题。针对该问题,本文在对缺陷模式分类的分析上,提出了基于触发路径约束求解的警报自动确认方法。本文的具体研究内容如下:(1)程
众所周知,自然界中的频谱资源是有限的,随着航天事业的飞速发展,频谱资源越来越紧张。在卫星对地的传输过程中,卫星的信号能被地面上的若干个地面站和接收船所接收,这些接收设备的环境各不相同,而设备接收信号的顺序会影响该频段的资源利用率,因此如何合理且高效地进行频谱资源的调度是航天测控领域中重要的问题。本文在航天测控系统单信道和多信道的场景下,对无线资源的管理与调度进行了研究。本文提出一种基于切片循环神经
随着网络发展,人们对网络的需求丰富,路由器需要对数据包完成更复杂的处理从而为用户提供更多的功能和更好的服务质量(QoS)。而高性能路由器单端口速率越来越快,为处理链路拥塞时缓存的海量数据包,通过无限增大路由器存储空间,对于路由器工艺设计来说难以实现,且因更复杂处理流程而增加的端处理延时无法改善。可以从路由器存储体系入手,增加路由器存储体系带宽,使单位时间内能够处理更多网络数据包,以进一步提升路由器