基于显式反馈的协同过滤推荐算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:COMMA87730030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,随着电子商务、社交网络和人工智能等技术的不断发展,信息量每天都在快速增加。面对海量数据,我们时常因为不知如何获取有价值的信息而倍感焦虑。智能推荐算法能帮助我们缩小选择范围,快速从海量数据中筛选出我们可能感兴趣的信息和物品。在众多推荐算法中,基于协同过滤的推荐算法是其中一类较为有效的算法,而且不需要领域相关的知识,因此通用性也较好。本文围绕协同过滤中的评分预测问题,以矩阵分解模型为基础,从两个方面对显式反馈(如评分数据)的建模方法进行改进,包括偏好上下文和用户隐私/数据安全。我们研究并分析了SVD++和MF-MPC两个有代表性的评分预测模型,发现它们对偏好上下文的建模方式虽然较为特别,但灵活性欠佳。针对这个问题,我们提出了一个改进的推荐算法k-CoFi。首先,我们从三个不同的角度对用户的偏好上下文进行建模,包括(1)关注相邻评分间关联性的k-granularity偏好上下文,(2)笼统地分为喜欢和不喜欢的k-partition偏好上下文,以及(3)侧重于无感感受的k-segment偏好上下文。其次,我们将以上三种偏好上下文抽象为一个统一的偏好上下文,即k-component偏好上下文。最后,我们在k-component偏好上下文的基础上,设计了一个新的协同过滤推荐算法k-CoFi。实验结果表明,k-CoFi是一个较为通用的推荐算法,能有效提高推荐效果,且不同偏好上下文之间具有一定的互补性。随着用户对个人隐私的重视,人们越来越难以接受将各方的用户评分数据聚合后再进行建模的方式。于是,如何在保护用户隐私信息的前提下实现多方数据的联合建模是推荐算法面临的一个重大挑战。在本文中,我们在共同矩阵分解模型(CMF)和联邦学习技术(FL)的基础上,设计了一个新的协同过滤推荐算法,即联邦共同矩阵分解(FCMF)。在FCMF中,我们在本地保留各方原始评分数据和用户潜在特征向量,选择敏感度较小的物品潜在特征向量作为联合建模的桥梁,并通过同态加密和差分隐私等技术来保护联合建模过程中各方隐私信息的安全。通过深入分析FCMF的联合建模过程,证明了该算法能有效保护各方的隐私信息。此外,通过真实数据集上的实验,发现同态加密和差分隐私技术对FCMF的联合建模效果没有明显的负面影响,且FCMF的联合建模效果与聚合各方数据的方法相当。
其他文献
危险驾驶行为不仅会造成了严重的交通事故,而且会导致重大的生命财产损失。对驾驶员危险特征进行提取有利于道路安全。很多保险公司无法识别在交通事故中产生了巨额赔付的驾驶员中的高风险客户,因此这是导致车辆保险行业利润减少的最重要的因素之一。所以对驾驶员进行危险特征提取有助于保险公司识别危险驾驶员,从而调整定价策略以提高盈利。因此,驾驶员危险特征提取在道路安全以及车辆保险计价均扮演重要的角色。传统的驾驶员危
资源枯竭和环境污染是当今世界上的两项巨大挑战。建筑作为人类主要的居住环境,是能源消耗和污染排放的主要贡献者之一,建筑业必须成为节能减排的重点,同时应承担为人类提供舒适健康的使用空间以及良好生态效益的任务。中国是目前世界上最大的排放国和最大的能源消费国,为解决这两个问题,促进绿色建筑的发展势在必行。绿色建筑可以在建筑的使用周期内尽可能最大化的实现节约资源、保护环境的目标,并且为人们提供健康舒适的使用
近年来,随着时代的发展,各地高校数量的增多,可持续校园的理念被运用于校园规划与建设中。步行作为最“绿色”的出行方式,得到校园可持续规划的重视。在新校园的交通系统规划设计中,逐渐体现出“人车分离”和“步行者优先”的设计原则。但在多数已建成的大学校园中,由于在规划设计之初对步行系统的重视不够,校内的步行空间存在着一些亟待解决的问题。针对这些问题,需要通过有针对性的优化设计,创造更加便捷、舒适的步行空间
移动边缘计算(Mobile Edge Computing,MEC)是一种新兴的计算范式,它在智能物流、城市智能交通和智能安防等方面都有着广泛的应用前景。在这些场景中,卷积神经网络(Convolutional Neural Network,CNN)是一种常用的技术。它在图像识别、物体检测等领域有着出色的表现。在过去,卷积神经网络的训练和推理都在云端完成。随着片上系统(System-on-Chip,S
随着世界各国军事现代化建设步伐加快,军队信息化程度越来越高,信息化战争已是大势所趋。为了适应快速变化的信息化战场局势,由本地指挥中心和各种战术终端组成的战术边缘网络应运而生。凭借自身高机动性以及强大的战场态势感知能力,战术边缘网络在信息化战争中扮演着越来越重要的角色。然而,在敌我双方对抗的环境下,敌方会通过各种手段攻击我方战术网络,特别是对于靠近战场前线的战术边缘网络,受敌方攻击和篡改的可能性更大
第五代移动通信技术(5th generation wireless systems,5G)在信道容量、时延、吞吐量等方面有明显的改善,其数据传输速率可达4G的数百倍。随着5G技术的飞速发展,5G的应用将渗透到各行各业,促进全球数字化转型。目前5G频谱在移动终端的商用主要集中在sub-6 GHz频段,毫米波频段的应用尚未成熟。由于5G高传输速率的要求以及手机终端尺寸的限制,5G终端天线必须要具备宽带
现如今,电子设备各式各样,有很多的因素决定着电子设备的性能。这其中,时钟源是一个比较关键的因素。时钟源就好像电子设备的心脏,电子设备要想正常运行,时钟源不可或缺。随着通信设备的普及,通信测量仪器的需求量也日益增多,现代通信设备测量仪器中,需要精准的时钟源,来保证测量数据的精确性。所以,精准的时钟源有着广阔的应用前景。但是,在使用时钟源的过程中,其输出频率会随着温度的变化而恶化。所以,对时钟源进行校
复杂系统在自然社会中无处不在,而网络科学是描述、分析、理解、设计复杂系统最常用的理论框架。网络科学的研究内容十分广泛且丰富,学习节点属性对网络连边进行预测是当下热门的研究内容之一,其中链路预测和推荐算法的研究都是根据节点相似性对网络未来可能产生的连边进行预测。链接预测是网络科学中重要的研究方向之一,具有巨大的研究和实际应用价值。近年来,网络表示学习的方法通过学习节点特征,使得链路预测的研究取得了重
近年来,推荐系统发展迅速,在诸如淘宝、京东、亚马逊等各大电商平台上随处可见,它在一定程度上给商家带来了可观的经济收益,同时也帮助用户更好地选择商品。传统推荐算法主要研究用户与物品之间的关系,然后给用户推荐最符合他们兴趣爱好的物品集。但在现实生活中,用户的历史行为隐含着某些辅助信息,例如相邻物品间的关系等信息。比如一个Java开发工程师,随着工作时间的增加,其阅读的书籍逐渐由入门类书籍过渡到更加专业
现今互联网中的数据大多呈现出规模庞大、结构松散的特点,使得人们从中获取有用的知识信息变得异常困难。知识图谱补全(KGC)技术是扩充知识图谱规模的关键技术之一,目前主要方法是基于已有的结构化信息以及无监督的学习方式对知识图谱进行补全。本文以知识图谱为研究对象,提出语义关联信息抽取模型,并在该模型基础之上衍生出两种开放式的动态知识图谱补全模型,工作主要包括以下三部分:(1)针对现有的知识图谱补全模型大