基于“神威·太湖之光”的大规模循环神经网络训练

来源 :清华大学 | 被引量 : 0次 | 上传用户:pldpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
循环神经网络是深度学习的重要组成部分,在序列处理问题中有广泛应用。循环神经网络最初主要应用在自然语言处理中,随着其性能和通用性进一步发展,很多领域内的识别及预测问题都出现了基于循环神经网络的解决方案。典型应用包括地球科学中的土地覆盖变化检测,遥感图像标题生成以及天气预报等。与深度学习其他主流网络的发展趋势类似,循环神经网络训练所需的数据量,网络结构的复杂程度以及完成训练所需时间,均迎来了指数级的增长。因此,如何在类似“神威·太湖之光”超级计算机这样的大规模并行平台上实现循环神经网络的大规模分布式训练,加速复杂网络的训练过程,成为了亟待解决的关键问题。大规模深度神经网络的训练基于数据并行的模式,通过增加训练批量的方式,提升模型遍历数据集的效率,从而提升模型收敛的速度。在“神威·太湖之光”上进行大规模循环神经网络训练的挑战包括模型训练的计算性能问题,分布式训练的通信效率问题,循环神经网络的内存分配问题以及在大规模训练情景下保证模型收敛速度和泛化性的问题。本文的主要工作包括三部分:1.本文在“神威·太湖之光”已有的分布式深度学习训练框架Sunway Caffe框架基础上,对训练过程中的模型测试模块进行分布式设计,缩短了模型测试所需要的时间,并对模型训练的分布式方案进行重新设计,隐藏了训练过程中模型测试的时间,为模型的高频测试提供了支持。2.本文针对循环神经网络的训练提出了多维度的优化。计算性能上,本文对计算热点指数函数和softmax函数进行优化,取得了12.63倍的整体加速效果;通信效率上,本文去除了循环神经网络训练中的冗余通信,针对“神威·太湖之光”的网络拓扑对MPI_Allreduce的实现进行重新设计,取得了20倍的通信效率提升;内存优化上,本文针对循环神经网络结构重新设计内存开辟方式,保证了内存的充分利用。3.本文对循环神经网络的大规模训练进行探索,包括优化算法的选择,训练规模的设计,以及对大规模训练过程中模型收敛速度、泛化能力的分析。最终,本文利用100个训练节点将循环神经网络收敛所需迭代步数降为单节点训练的约1/100;并在此基础上进一步将训练节点规模扩展到800,以实现对具有更大参数规模的循环神经网络的训练的支持。
其他文献
<正>为帮助学生发展健全人格,对小学生进行心理健康教育是很有必要的。小学班主任应掌握渗透式心理健康教育能力,合理的进行心理健康教育工作,帮助学生培养健康的心理。小学
会议
<正>中国西南地区在气候上主要受到印度洋季风的影响,因此在末次冰期期间,该地区气候变化相比中国其他地区有明显不同。例如MIS 3期间,中国东南地区气候较为暖湿,而西南地区
会议
各种葡萄大量上市的季节,巧手的主妇们可以在家酿制红葡萄酒,利用自然发酵而不用任何添加剂和防腐剂,价格便宜,干净卫生,味道也纯正,喝起来特别放心。  一定要在葡萄大量上市时买自然成熟的葡萄。尝尝味道,较甜的一般是成熟了的。不要买反季节的大棚里栽种的葡萄。看看果蒂处,如果是青的,而且味道酸,就可能打了催红素,这样的葡萄最好不要买。常见的巨峰葡萄、提子、马奶子等,都可以用来制作葡萄酒。  发酵用的容器可
针对图像认证系统易受到窥探攻击的问题,提出一种基于视线交互的图像认证系统。系统中,眼动仪记录用户的眼球运动并将其作为输入控制信号,用以生成系统的用户名和密码,进而抵御窥探攻击。用户测试研究验证系统的可用性和有效性,实验的平均成功率为85.71%;随着用户熟悉程度的提高,用户认证成功率逐渐升高。
食之有道,能养身防病,食之无道,可伤身致病。正如医圣张仲景所说:“若得相宜则益体,害则成疾。”可见,讲究“食”的科学性和合理性是很重要的,专家们认为人们在吃上要注意以下六点。  熟食 以熟食为主。高温煮食,可以杀菌灭毒,能把对人体有害的物质分解,挥发或转化成无害的物质,同时还确保食物所含的营养成分充分释放。这既有利于食品的营养卫生,又有益于人体的消化吸收。  配食 即对饮食进行调配使其更趋科学合理