【摘 要】
:
随着“大数据”时代的到来,互联网上积累了非常庞大的数据。现今在很多互联网服务中,从海量候选商品中精确地推荐用户感兴趣的商品作为一个至关重要的任务引起了专家学者的广
论文部分内容阅读
随着“大数据”时代的到来,互联网上积累了非常庞大的数据。现今在很多互联网服务中,从海量候选商品中精确地推荐用户感兴趣的商品作为一个至关重要的任务引起了专家学者的广泛关注。这种背景下涌现出大量的推荐算法,其中基于隐因子矩阵分解的协同过滤是一类热门方法。但随着数据量以惊人的速度持续增长,传统协同过滤的方法推荐时间代价过于高昂。为了克服可扩展性的问题,基于哈希学习的思想,离散形式隐因子学习的推荐方法被提出。该类方法可以用次线性时间复杂度完成Top-K商品推荐,从而极大地提高了推荐效率,但是也存在着以下这些局限性:(1)现有基于离散隐因子学习的推荐方法在学习用户和商品的离散隐空间表示时仅考虑用户-商品之间的跨模态关联信息,即用户对商品的评分矩阵,忽略了用户-用户/商品-商品的模态内相似度信息。(2)现有基于离散隐因子学习的推荐方法面临着推荐系统著名的冷启动问题和长尾问题。冷启动问题是指由于缺少相应的评分数据,推荐系统无法对新用户/新商品进行准确推荐。长尾问题是指推荐系统倾向于推荐被大多数用户喜爱的流行商品,然而却忽略了一些可能会被某些用户喜欢的小众化商品。针对上述两个问题,本文的进行了如下三个工作。(1)离散流形正则化协同过滤:受流形学习启发,本文提出了离散流形正则化协同过滤方法。该方法联合考虑用户-商品跨模态关联信息和用户-用户/商品-商品模态内相似度信息,学习用户/商品在海明空间中的紧致编码。为了降低量化误差,该方法采用离散循环坐标下降的算法直接对离散形式的目标函数进行优化。实验结果表明:在推荐性能上,本文提出的离散流形正则化协同过滤方法优于现有基于离散隐因子学习的推荐方法;在冷启动推荐方面,该方法能够基于用户/商品属性更充分得学习到用户对商品的偏好信息,将知识从旧的用户/商品转移到新的用户/商品中,从而可以有效地改善冷启动问题。(2)基于低秩稀疏分解的离散协同过滤:在上述方法的基础上,为了进一步提高推荐的多样性,本文提出一种基于低秩稀疏分解的离散协同过滤方法。该方法将用户对商品的评分矩阵分解为用户对流行商品的评分矩阵和用户对小众化商品的评分矩阵两个部分。通过分别对这两个部分施加低秩性约束和稀疏性约束,该方法学习用户、流行商品和小众化商品在海明空间中的紧致编码。类似的,该方法采用离散循环坐标下降的算法直接对离散形式的目标函数进行优化以降低量化误差。实验结果表明本文提出的基于低秩稀疏分解的离散协同过滤方法不仅优于现有基于离散隐因子学习的推荐方法,而且能够有效改善长尾问题。(3)基于孪生图卷积网络的离散协同过滤:为了更进一步挖掘用户-用户/商品-商品模态内的相似度信息,本文提出一种新颖的基于孪生图卷积网络的离散协同过滤方法。该方法将用户-用户相似度和商品-商品相似度构建为两个图,图中顶点代表用户/商品,边代表顶点之间的相似度。该方法使用图卷积网络提取用户/商品的高层特征,并学习用户/商品的离散编码。实验结果表明,相比较于现有基于离散隐因子学习的推荐方法,本文提出的基于孪生图卷积网络的离散协同过滤方法提高了推荐效果,并且具有较低的训练时间代价。
其他文献
背景:肺癌作为世界上危害人类健康最严重的恶性肿瘤之一,其每年的发病率和死亡率均居所有肿瘤之首。肺癌在中国男性人群中的发病率和死亡率位居所有肿瘤首位;女性中发病率居第二位,死亡率居第一位。肺癌是一种多病因疾病,其发生发展并不是由单一的环境因素或者遗传因素导致的,是二者共同作用的结果。吸烟是影响肺癌发生的最主要的危险因素,然而,吸烟引发的肺癌仅占不到20%,提示不同人群对肺癌的易感程度存在差异。为了更
对外直接投资作为各个国家“走出去”的一项重要的活动,在世界经济发展中扮演着越来越重要的角色。国际投资活动最早发生于发达国家,很少有发展中国家进行该项活动。随着世界经济的迅猛发展,发展中国家逐渐开始进行国际投资活动。原来关于投资理论的研究大都是针对发达国家展开的,但是这些理论直接应用于发展中国家有一定的局限性,中国作为典型的发展中国家,其投资理论具有一定的代表性,所以本文从东道国不确定性视角研究中国
大规模应用软件系统由于其规模大、程序文件多,导致软件系统的编译过程特别耗时。特别是在软件系统开发和升级过程中,由于需要频繁进行软件系统集成,从而使得系统的编译耗时
随着经济全球化的不断发展,本地化作为一个新兴行业,已经成为跨国公司进行产品国际化营销的重要战略。同时,本地化行业所取得的巨大进步也带动了国内外翻译市场的蓬勃发展。
随着面向服务计算的普及,大量功能相同或相似的Web服务涌现出来。当Web服务的数量过于庞大时,对用户来说选择最佳的Web服务成了一件十分困难的事情。因而,如何帮助用户了解更
传统橡胶沥青具有总体成本较低、性能较优良等优点,但存在用油量大、储存稳定性较差等问题,本文在前人研究成果的基础上,提出了用化学改性剂处理废胶粉,从而达到提高废胶粉改性沥青性能的目的。结果表明:胶粉掺量28%(外掺)、活化剂掺量2.5%、交联剂掺量3%、软化剂掺量2%、剪切速率5000r/min、剪切温度180℃、剪切时间30min、发育时间45min为制备基于化学改性的废胶粉改性沥青的最佳掺量和最
自适应网格加密框架AMROC(Adaptive Mesh Refinement in Object-oriented C++)是开源的块结构自适应网格加密框架,可以用于模拟多相流计算、燃烧、流固耦合等问题。Initition
大气污染已成为威胁人类健康的主要因素之一,与呼吸系统疾病、心血管系统疾病以及生殖系统疾病的发生均有较强的关联。世界卫生组织(WHO)报告显示,大约80%的城市居民居住在空气质量不符合世界卫生组织空气质量标准的地区。中国正处于社会经济快速发展阶段,面临着严重的大气污染问题。长江三角洲地区作为城市化进程最快、经济实力最强的地区之一,大气污染状况尤其是大气颗粒物污染状况值得关注。研究表明,全球约有10%
图像分割在计算机视觉系统中占有非常关键的地位,被广泛应用于医学分析、交通控制、机器学习、人脸识别等诸多领域。相比于传统分割算法,近几年提出了层次分割算法给图像处理和应用带来了更优的效果。通常情况下,每个图像都有自己的最优参数集,一个固定的参数设置可能会导致不满意的分割。为了给目标检测任务提供高水平的分割结果,本文对层次图像分割的层次选择技术和目标分割算法进行了研究,利用层次图像分割结果中隐含的区域
大众体育有“第二奥林匹克运动”的美誉,一个国家的兴盛强大和人民的健康福祉离不开它。国务院在2014年10月2日颁布了《关于加快发展体育产业促进体育消费的若干意见》,明确