基于梯度优先级的分布式深度学习的通信优化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:altertig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习技术的问世让人类的生活越来越便捷,其使用具有许多参数的深层结构来实现模型的高精度。随着信息的高速发展,人类所产生的数据也以爆炸式地增长,单个节点无法在短时间内完成对海量数据的训练,于是分布式深度学习也应运而生。参数服务器是目前分布式深度学习广泛使用的通信拓扑结构,其将集群分为工作节点和服务器节点,工作节点需要进行计算和与服务器节点进行网络通信,服务器节点负责接收工作节点的参数和将参数进行聚合。因为工作节点中,计算与通信是串行的,因此存在着资源的不充分利用。针对基于参数服务器中资源不充分利用的问题,分别提出了基于非抢占式优先级与抢占式优先级的计算与通信相重叠的策略,在简单的计算与通信相互重叠的策略上更进一步的优化。在基于梯度优先级的策略中,将反向传播计算完成的梯度赋予不同的优先级别,网络层数越低其优先级越高,然后在进行梯度推送时,将根据优先级高低来将梯度推送到服务器节点,这样优先级高的低层梯度可以更早地推送到服务器节点进行聚合,然后可以更早地进行下一轮的迭代计算。在根据优先级推送梯度时候,可分为非抢占式与抢占式中断两种策略,非抢占式的策略只能等待当前梯队推送完毕后才能继续推送下一梯度,抢占式中断策略则可以通过高优先级的梯度中断低优先级梯度来更快地将高优先级梯度推送到服务器节点进行聚合。针对提出的两种不同通信策略,通过对开源分布式深度学习库Big DL进行代码修改来验证两种通信策略的效果。采用在三个常见深度学习模型进行实验,并对实验结果在集群可拓展性与执行时间上进行分析,可以看出,基于梯度优先级的策略在集群可拓展性与执行时间上相比默认的策略都有了明显的提升。
其他文献
烟草行业是我国税收的重要支撑,烟草在存储和加工过程中长期受到烟虫的侵害,造成了行业经济损失。目前对烟虫的监测主要依靠人工对烟虫诱捕器进行识别与计数,存在效率低和实时性差等弊端。研究具有烟虫自动识别和计数的机器视觉系统,对于提高类似的害虫监测和控制具有理论和实践意义。论文实现了三种烟虫检测方法并开展了比较研究。首先采用基于分水岭算法的传统图像识别方法,用分量法和Otsu阈值法对图像进行二值化,并用形
[db:内容简介]
脱口秀节目是一种以喜剧为根本的语言类的表演,重在语言应用,幽默的语言是脱口秀节目可持续发展的内生动力。基于Grice的合作原则,探讨幽默语言产生的机制,对近年来火爆的几档脱口秀节目的言语幽默进行深度探究,以期为脱口秀节目的可持续发展提供语言策略的支持,进而提升其吸引力和竞争力。
随着通信、计算机技术的发展,数字电视、视频会议等传统媒体产业爆炸式发展,这给数据存储和网络传输带来了巨大挑战。数字视频压缩编码在其中起到了巨大的作用。例如目前应用广泛的高效视频编码H.265/HEVC(High Efficiency Video Coding),还有最新发布的H.266/VVC(Versatile Video Coding)视频框架。同时,随着人工智能和5G时代的到来,人们生活方法
新型社会治理格局下,要实现社会的和谐发展,应该利用好政府公共关系这个平台,实现政府与社会组织和公众之间的良好互动。地方政府应重视公共关系的构建和发展,积极转变观念,加强与社会组织及公众之间的沟通交流,构建相互信任、相互支持的良好关系状态,以对话协商的方式促使各主体参与公共事务的管理并达成共识。
随着图像视觉技术的不断发展,传统相机在信息获取手段单一,以及不具备景深自动调节能力等问题难以满足人们对信息获取多样化的需求,而光场相机的发展在一定程度上满足了这一需求。基于传统相机的成像技术只记录了光信号的空间位置信息,为了获得准确的对焦面,拍摄时需要先调整镜头对焦再拍摄,而Lytro光场相机作为一种新型相机可以通过一次拍摄,同时获得光信号在空间中的位置信息和方向信息,多维信息的获取为光场相机先拍
近年来,很多优秀的单目标跟踪算法被研究者提出来,在主流的目标跟踪数据集上取得了长足的进步。然而,这些方法大都将注意力放在目标分类方面,目标尺度的评估却没有得到足够的重视。大多数目标跟踪网络对目标尺度评估的方式有以下几种:多尺度测试,预设固定尺度Region Proposal Network(RPN),反向迭代优化等方式。这些目标尺度评估方式没有考虑到相邻帧之间的潜在信息。为了更好的对目标尺度进行评
相变材料因为具有较大的潜热值以及相变温度稳定等优点已经在航空航天、建筑节能等领域得到了广泛的利用,然而相变材料过冷及相分离等问题制约了实际使用效果,本文对水合盐这一常用的无机相变材料的过冷问题进行了研究,提出了一种新型的有效解决过冷问题的方法。本文首先在原理上对水合盐材料过冷的问题进行分析,随后通过对比目前常用的抑制水合盐过冷的方法以及在实际应用中的优缺点,结合水合盐应用到现实所面临的问题以及热电
随着机器学习理论的不断发展,人工神经网络算法已经广泛运用于图像识别、自然语言处理、模式分类和决策控制等多个领域,并取得了优秀的应用成果。但是,利用基于冯·诺依曼体系架构的传统数字计算机实现人工神经网络算法会产生过高的功耗,这在硬件层面上限制了人工神经网络的应用范围和进一步发展。新型基本电路元件忆阻器具备记忆特性,在信息存储、混沌电路设计、细胞突触功能模拟等方面有着广泛的研究前景。利用忆阻器能够实现
活塞表面的温度数据是研究内燃机缸内燃烧和传热问题不可或缺的基础数据,但它的测量难度极大。首先,它具有高度的瞬态特性,温度传感器的响应速度必须足够快,才能捕捉到活塞表面的温度变化,传统的温度传感器难以满足要求。为此,本文在深入研究热电偶的测温原理、动态特性、以及加工工艺的基础上,考虑活塞中耐振动、耐高温、便于封装和引线等特殊要求,设计并制作了一款轴状薄膜热电偶。试验结果表明,该轴状薄膜热电偶的塞贝克