基于梯度压缩的深度学习算法分布式计算研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户：vera17

【摘要】

：

【作者】

：

罗鹏

【机构】

：

深圳大学

【出处】

：

深圳大学

【发表日期】

：

2020年01期

【关键词】

：

深度学习深度神经网络分布式计算梯度压缩算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,物联网、边缘智能和边缘计算等技术在网络边缘上生成了大量数据,而这些日益增多的数据需要在越来越复杂的深度学习算法上进行训练,以检测、分类和预测未来事件。这个趋势在未来还会继续扩大,为了加快深度学习算法的训练速度,分布式计算正变得越来越重要。然而分布式训练在主节点与计算节点间进行着频繁的梯度交换,这使得训练承受着巨大的通信开销,并且限制了分布式深度学习的训练效率。为了降低分布式深度学习的通信开销并提升其训练效率,梯度压缩算法开始受到关注,并逐渐成为该领域的一个重要的研究方向。本文通过对基于自适应压缩框架的梯度压缩算法（AdaComp）进行研究和分析发现,虽然AdaComp算法在解决分布式深度学习的通信开销问题上取得了不错的效果,但其通信量依然很大,不能适应边缘节点有限的通信带宽和算力,因此需要进一步降低分布式计算节点之间的通信和计算开销。本文针对AdaComp算法,层层递进地提出了相应的改进方案,具体研究工作及创新点包括以下三个方面:首先本文提出了一种基于选择的梯度压缩算法（SGC）,该算法的核心思路是根据梯度数量制定选择策略,从而在模型中有选择性地压缩符合要求的层,而不符合要求的层则不进行压缩。相比于AdaComp,SGC通过降低模型压缩的频率,有效地提升了分布式训练的速度,而且由于模型的压缩程度略微下降,训练的准确率也有所提升。其次本文提出了一种基于自适应概率的梯度压缩算法（ProbComp-LPAC）,该算法的核心思路是采用概率公式来选择并压缩梯度,并在模型的不同层中使用不同的压缩率。ProbComp-LPAC包含两个压缩算法,分别改进训练速度和训练准确率。相比于AdaComp和SGC,ProbComp-LPAC更好地提升了分布式训练的速度,而且训练的准确率也更高。除此之外,相比于惰性聚合量化压缩算法（LAQ）,其更好地提升了训练的准确率。最后本文还提出了一种适用于梯度压缩算法的选择上传方法（SUM）,该方法的核心思路是根据当前梯度对总体损失函数的贡献制定选择上传策略,从而判断当前计算节点是否需要上传本次训练的梯度更新。相比于ProbComp-LPAC,SUM通过降低各个节点之间的通信频率,在保持训练准确率基本不变的基础上,进一步提升了分布式训练的速度。而相比于LAQ,SUM在训练准确率和训练速度上均有优势。

其他文献

基于时间和空间双流神经网络的步态识别

步态是一种流行的生物识别技术,可以远距离识别人类。它应该是唯一可以在远距离收集的生物特征。由于其独特的优势和在视频监控中的巨大潜力,在过去的20年中,许多研究人员对其进行了研究。尤其是近几年来,随着深度学习的发展,步态识别有了很大的提高。如今指纹、人脸识别的技术愈发成熟,但是步态识别技术的应用还面临许多挑战,比如摄像头视角变化、衣着变化等对识别的影响,所以我选择步态识别这个课题,希望能为解决步态识

学位

步态识别时序特征时空网络视频序列

自适应多目标多/超多任务算法

多任务进化是进化领域中的一个新兴研究方向,主要研究如何充分利用任务之间的协同作用提高种群搜索的效率和性能。相对于传统的单任务进化,多任务进化能够通过多个任务之间的知识迁移提高算法的性能和进化的效率。基于多任务进化框架提出的单目标多任务进化算法和多目标多任务进化算法已经进化获得了优异的成果。本文对多任务进化算法进行了研究,并且对该领域做出了以下贡献:（1）提出了一个基于种群分布的两阶段知识迁移多任务

学位

进化算法多目标进化多任务进化超多任务进化知识迁移

基于深度学习的图像去噪紧框架正则化参数估计研究

图像是日常生活中的重要信息媒介,在获取、使用等过程中,不可避免受到噪声的影响,破坏图像的质量,妨碍后续的处理。图像去噪问题是典型的病态逆问题,通常是图像迭代求解算法的关键步骤,需要利用先验信息对其进行正则化约束。通常图像去噪技术利用单幅图像的各种先验特征,结合不同滤波方法完成去噪,可采用的先验信息有限,难以有效选取特征保护图像边缘细节,且需手动多次调整参数,效率较低。近年来以卷积神经网络为代表的深

学位

图像去噪深度学习紧框架正则化参数估计

基于多视角视觉信息的餐厅推荐系统算法研究

随着信息科技的逐步发展,人们越来越能更加快捷方便地获取信息。但网络技术的迅猛发展与网络信息量的快速增长,却使人们逐渐迷失在大量无效信息的包围中。信息超载问题伴随着信息科技与互联网的发展逐渐被人们重视、研究,由于信息超载问题使得人们在面对海量信息时无法有效获取自己感兴趣或者对自己真正有用的信息,使得信息整体的使用效率降低。与搜索引擎依靠特定策略和算法对用户提交的关键词进行搜索不同,作为解决信息超载问

学位

推荐系统深度学习矩阵分解视觉特征注意力机制

基于指标和分解的超多目标进化算法研究

多目标优化问题在现实生活中广泛存在,这些问题具有复杂度高,不易求解等特点,传统的数学方法难以对该类问题进行很好的求解。为解决这个问题,多目标进化算法被提出来并获得了广泛应用。多目标进化算法是启发式搜索算法中的一种,在处理多目标优化问题上,该类算法表现出了良好的鲁棒性和适用性。然而,随着目标个数的增加,这些多目标优化算法的有效性将逐渐地失效。原因是当目标数大于三个时,非支配解的数量将快速的占据整个种

学位

超多目标优化进化算法边界保护策略目标空间转移

基于变异与选择策略的超多目标进化算法研究

多目标与超多目标优化问题广泛存在于现实世界当中,处理好这些问题具有重要的现实意义。然而,这些问题具有多个需要被同时优化且可能相互间存在冲突的目标函数,导致传统的数学方法很难进行处理。进化算法是一种基于种群的启发式算法,具有较强的搜索能力,能够解决很多传统方法无法解决的优化问题,已被广泛用于求解多目标与超多目标优化问题。近年来,为处理好超多目标优化问题,学术界提出了大量超多目标优化算法（Many-o

学位

超多目标优化进化算法变异策略选择策略

商业综合体动线系统及其室外公共空间设计相关问题研究 ——以某城市滨江项目沿江地块为例

随着我国商品经济的飞速发展,人民精神需求水平日益提高,城市商业空间愈发受到公众关注。其中,动线系统和室外公共空间不仅是设计中的主要关注点和要素,更可作为整个商业建筑的点睛之笔和亮点所在,增添城市商业中心的活力。本文以环境行为学及消费心理学作为全文的理论铺垫和基础,以空间的合理性、流畅性、趣味性和活力性的分析视角来研究现当代商业综合体动线系统及外部公共空间的设计的现状情况,并以问卷调查和实地调研的研

学位

商业综合体动线系统室外公共空间公共步行连桥体验式消费

基于SVR的混合模型预测股价

在金融市场,股票预测一直是投资者和学术界的热门研究话题之一。随着经济全球化和股票市场的不断成熟,发展出了多种股票投资方式。近年来机器学习在多个研究领域取得了显著的成果,其中在股票预测方向除了传统的预测方法外,研究人员提出许多新的方法,并对已有的方法不断进行改进。例如利用深度学习预测股票中使用深度卷积网络、深度Q网络以及基于LSTM（长短期记忆网络）的深度循环神经网络预测股票。还有基于SVR（支持向

学位

股价预测SVR小波变换滑动窗口

基于值的免模型深度强化学习算法研究与改进

强化学习是一类关键的机器学习方法,普遍应用于以目标为导向的训练环境,并基于目标在环境中自发地探索最优策略。近来已在一些领域,如游戏操控、机器人操控、车辆自动驾驶等工程应用的部分问题中,获得显著的成绩,其中包括动态规划算法,应用于已知完整的马尔可夫问题模型;蒙特卡洛算法,与时间差分算法基于无模型问题进行寻策,是本文的主要研究内容。深度学习在机器学习中作为另一大热门研究技术,使用非线性的神经网络于分析

学位

强化学习探索与利用噪声探索状态估计迁移学习

面向复杂多目标优化问题的进化算法研究

多目标优化问题广泛存在于科学研究与实际工程应用中。由于多个优化目标之间相互冲突,单个解不可能同时使所有的目标都是最优的。因此,多目标优化问题的最优解是由多个帕累托最优解组成的集合。进化算法是一种基于种群的元启发式算法,能同时优化一组解。因此,在求解多目标优化问题时,进化算法是一种非常适合的优化算法。然而,随着多目标优化问题复杂性的变化,现有的多目标进化算法越来越难以平衡种群的收敛性与多样性。因此,

学位

多目标优化进化算法进化搜索聚类

基于梯度压缩的深度学习算法分布式计算研究

其他学术论文