基于多GPU的协同过滤推荐算法研究及应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:honeypan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的爆炸式增长,信息超载导致人们很难在短时间内从海量信息中获取自己感兴趣的信息,个性化推荐系统作为信息过滤的一利一重要手段应运而生。协同过滤推荐算法是目前使用最广泛且最成功的算法。然而随着大数据时代的来临,当推荐系统规模巨大时,算法计算密度迅速增大而变得十分耗时,从而导致推荐滞后,用户体验性差,因此传统的算法面临可扩展性问题。当前人们主要运用分布式集群技术来提高算法效率,但由于其成本过高导致很多研究者及中小企业都无法承受。与CPU相比,GPU(Graphic Processing Unit)具有更大的内存带宽,更多的执行单元,更低的成本等优势,十分适合解决海量数据并行计算问题。然而单个GPU的计算能力还是有限,多GPU则能够提供更加强大的计算能力。因此本文提出了一种基于多GPU的协同过滤推荐算法。实验结果表明多GPU并行计算能显著提升算法运行速度,与CPU上的串行算法相比,最大加速比达到了260倍,而且问题规模越大加速比越大。与集群相比,具有更高的性价比。此外,还将本文提出的基于多GPU的并行算法应用到网络机顶盒个性化视频推荐中并实现了一个简单高效的推荐系统,为中小企业节约成本提供了一种可行方案。本文的多GPU并行推荐算法具有可扩展性,实际应用时可以添加更多的GPU以满足更高的性能要求。本文有以下两个创新点:(1)为了解决可扩展性问题,设计并实现了一种基于多GPU的协同过滤推荐算法。针对大数据时代,推荐系统计算密度强大和GPU显存有限问题,设计了多GPU并行算法并使用CUDA (Compute Unified Device Architecture)实现了该算法。解决了一系列问题包括:多GPU并行任务划分问题,多GPU动态数据加载及存储问题,相似度计算、寻找K最近邻、预测评分并产生Top-N推荐在多GPU中的并行实现问题。通过对比不同平台上的算法运行时间证明了多GPU并行计算可以显著提高算法效率。(2)将本文研究的基于多GPU的协同过滤推荐算法应用到网络机顶盒个性化视频推荐系统中。系统首先通过挖掘用户访问日志获取用户对视频的评分,然后应用本文提出的并行算法进行推荐,最后展示推荐结果。
其他文献
目前,不同汽车厂商、产品类型和总线类型提取车辆信息的方式各不相同。每个汽车制造商对CAN总线信息的编码也大不相同。大多数汽车制造商都采用了CAN标准,所以车辆之间的应用层
根据Gross情感调节过程理论,情感调节主要是调节者通过情境选择、情境修正、注意分配、认知重评、表达抑制五个阶段对自己的不良情感进行自我调节,自我消化的过程。主要的调
随着基因组计划的完成,人类步入后基因组时代,逐渐认识到蛋白质分子在生命过程中的重要性。研究表明,蛋白质分子并不单独发挥作用,它通常与其功能相似的蛋白质分子聚集形成大
移动Ad hoc网络(Mobile Ad Hoc Network, MANET)是一种由无线移动节点组成,是一种无需固定网络基础设施的支持并能够迅速投入使用的网络体系,各个网络节点通过无线信道进行通
互联网技术的发展给人们日常生活带来便利的同时,也使人们淹没在信息的海洋中,很难找到自己所关心和需要的信息。随着web2.0的飞速发展,面对传统搜索引擎暴露出来的诸如不能
随着互联网的普及和云计算的发展,海量数据处理成为IT从业人员越来越重视的课题。海量数据处理常采用并发的方法,即多个线程同时运行在多台处理器上,共同访问和处理共享数据
随着照明技术以及半导体产业的飞速发展,半导体照明技术越来越受到广大厂商的青睐。同时消费者也对照明的易用性、多样性、节能性、高效性,提出了更高的要求。与此同时,由于照明会带来的巨大能耗和产生的环境问题,各国政府也越来越关注半导体照明产业,众多国家发布了淘汰白炽灯的计划,这就为新一代半导体照明即LED照明产业的发展奠定了基础。未来节能与环保成为照明系统发展的主要方向,因此与半导体照明技术相关的控制芯片
随着因特网及数据挖掘技术的快速发展,因特网软件的使用者对个人隐私数据的安全给予了越来越多的关注。通过WEB服务或服务组合建立起来的软件不但要重视功能需求,还应该重视
自P2P网络问世以来,就受到了越来越多的关注,现已被使用在各种各样的网络应用中。P2P网络改变了传统网络中的客户端/服务器模式,采用端对端原则,网络中所有实体之间都是平等
随着互联网的普及,日益增长的网络流量和不断出现的各种网络新应用大大增加了网络的复杂性和管理难度,这严重威胁到网络服务质量和网络安全,对网络管理提出了巨大挑战。在这种情