Tensorflow资源及批尺寸协同配置研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:angeldd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式机器学习用于增强模型训练性能,提高模型预测精度。大数据时代,模型训练作业所使用的训练数据集体量庞大,对于模型训练作业的耗时成本以及预测精度均有着较高的要求。Tensorflow系统是实现大规模分布式机器学习模型训练的典型代表,提供了资源配置和超参数设置来调整模型训练作业的计算性能及训练精度。既有Tensorflow系统,资源和批尺寸配置分离设置,用户通常利用历史经验直观地人工设定,或者通过反复尝试找到一组合适的参数组合。而由于用户往往缺乏对训练作业特性及系统的深刻理解,随着模型训练作业的持续运行,人工设置费时、盲目的弊端就会突显。另一方面,实验结果表明在不同的资源配置下,获得最优计算或精度性能的批尺寸设置是不同的。将两者分离配置难以达到在最小化资源配置的情况下,通过优化批尺寸配置,提高模型训练可达到的精度及计算效率。针对上述问题,本文在保障模型训练计算效率和精度要求的前提下,以最小化训练成本和最大化模型精度作为性能优化目标,提出两种资源-批尺寸协同、自动优化配置方法,具体工作如下:1)量化分析了Tensorflow系统中资源配置与批尺寸配置对模型训练计算效率和精度效率的影响。揭示了资源配置与批尺寸配置对模型训练作业性能优化的互补特性,并揭示了在典型模型训练作业中,批尺寸配置与模型训练计算效率及精度效率间存在单调的函数关系。2)提出了基于静态的Tensorflow资源-批尺寸协同优化配置方法。该方法首先依据资源配置和批尺寸配置与模型训练作业计算效率和精度效率间的单调函数关系,选取多维保序回归理论工具,以资源配置规模、输入数据规模和批尺寸设置为特征,构建模型训练负载计算时间预测模型;以批尺寸设置、迭代轮次为特征,构建模型训练负载的精度预测模型。然后,协同使用上述模型,求解以资源成本最小化为目标,保障训练精度和计算效率的资源和批尺寸优化配置解。3)提出了基于分阶段的Tensorflow资源-批尺寸协同配置方法。该方法依据随着模型训练迭代轮次的增加,作业精度收敛速度逐渐放慢且不同阶段对资源-批尺寸参数配置组合具有不同敏感度的观测,提出分阶段的协同优化配置。该方法基于深度强化学习构建分阶段优化配置决策模型,通过在精度收敛较快的前期阶段配置更多的资源和优化的批尺寸设置,加速模型训练的最终收敛,并进一步降低资源成本。4)采用典型神经网络结构及数据集,对上述两类方法进行了性能评测。实验结果表明,对比基于人工经验为主的参数设置进行模型训练作业,基于静态的资源-批尺寸参数设置和基于分阶段的资源-批尺寸参数设置能更好的在完成训练作业的同时节省资源成本。在基于静态的资源-批尺寸参数设置方法中,限定时间和精度后能够最大节约成本35%;在基于分阶段的资源-批尺寸参数设置方法中,限定时间和精度后能够最大节约成本30%;两者相比较在相同限制条件下运行模型训练作业,基于分阶段的资源-批尺寸参数设置方法较之基于静态设置方法能最大节约40%的资源成本。
其他文献
本文主要研究带记忆项的非自治扰动黏弹方程拉回吸引子的上半连续性。(?)特别地,在一些适当的假设下,我们证明了,当ε>0时,方程拉回吸引子{Aε(t)}t ∈R的存在性,与当ε = 0
本文以川西北铀矿区铀废矿为研究对象,在广泛研究现有环境安全评价模式的基础上,建立一套针对铀废矿石堆的环境安全评价模式,用于客观评价铀废矿石堆环境安全状况,为安全管理
本选题的翻译素材来自平潭市政府门户网新闻英译项目。随着中国对外开放的不断深入,部分地方政府开始建立对外新闻网站,不断加强自身对外宣传,吸引广大外商投资、境外旅游等。地方新闻报道的中文翻译是外语读者掌握中国当地经济发展,政治和文化的重要途径,也是让外语读者了解中国各地特色文化的合理手段。地方新闻取材广泛,翻译目的明确,应用性强,属于应用型翻译。新闻翻译具有很强的目的性、时效性、事实性和文化差异性。根
“加快建设创新型国家”是我国目前的重要战略目标,创新也已经成为当代热词之一。作为社会经济进步的主要推动力,创新能力是我国完善社会主义现代化经济体系的重要保障;同时,随着以智能、绿色为特征的先进技术进入国际舞台,创新水平也成为一国在国际竞争局面下竞争实力的重要体现。企业是国家创新的主体,承担着开展科技创新、驱动经济发展的重任。税收优惠就是国家通过“看得见的手”干预和调控宏观经济的一种重要手段,它被作
人民有信仰,民族有希望,国家有力量。信仰、信念、信心在任何时候都至关重要。信仰是一个国家和民族发展的不竭动力,也是个人成长成才的“精神之钙”,习近平总书记也多次在讲话中强调理想信念的重要性,高校理想信念教育成为了一个时代课题。当前中国特色社会主义进入了新时代,这是一个大有所为的历史时期,但也面临着十分严峻的挑战,由于社会多元价值观的侵染,不良社会思潮的传播,人们的价值取向趋向功利化,导致大学生避谈
卵巢早衰指的是女性在初潮至40岁以前的这段时间内,由于多种因素的影响,使卵巢生理功能出现衰退,从而导致出现一系列的症状表现。属于妇科常见疾病的一种,病情的出现会对广大
本文主要研究几类具有不连续系数二阶拟线性微分方程的奇异摄动边值问题,运用上下解方法证明在满足一定条件下解的存在性,并用微分不等式给出解的余项估计.首先研究下面具有
在经济新常态背景下,国家陆续出台一系列政策和文件,加快推进企业转型升级。受行业发展和国家政策的影响,产业融合成为传统企业进行业务转型的重要途经。一大批传统行业企业开始向互联网、新能源汽车等新兴行业拓展,进行并购重组,形成了混合并购的热潮。混合并购有助于优化企业的产业结构,促进资源的合理配置。但是现阶段中国上市公司的混合并购出现了很多问题:被并购方业绩不达标、巨额商誉减值等。在这种背景下,分析混合并
语文教参在教学中具有重要作用,本文以部编版八年级语文教参为研究对象。首先,从教参体例和教参内容切入,分析了教参的编写情况。其次,采用问卷调查法和个案分析法考察教师对教参的使用情况。最后,以前两章对教参编写情况和使用情况的分析为依据,提出了教参编写和使用的建议。本论文主要由以下几个部分构成:第一章,部编版八年级语文教参在编写时结构科学,内容丰富。在结构上教参由前文、正文和后文组成。在内容上五个模块由
造山带和沉积盆地是大陆的两个基本地质单元,它们构成了在空间发展和形成机制上密切联系的构造系统,这种共生关系即为盆山稱合。当构造活跃时,山体加快隆升,物源区遭受更强的