【摘 要】
:
Spark作为基于DAG的分布式计算框架广泛应用于电商、物联网、数据分析等复杂大数据处理,其中Task调度是影响大数据分析性能的关键因素。随着应用程序的扩大和数据量快速增长,
论文部分内容阅读
Spark作为基于DAG的分布式计算框架广泛应用于电商、物联网、数据分析等复杂大数据处理,其中Task调度是影响大数据分析性能的关键因素。随着应用程序的扩大和数据量快速增长,依靠单个数据中心无法满足海量数据的存储和处理。此外,数据中心内部随着高性能机器的引入,原有的数据中心已经变成由异构节点组成。因此,研究异构Spark集群下的Task调度具有现实意义。本文考虑基于异构Spark集群下的Task调度问题,以最小化最大完工时间为优化目标。首先提出改进后的系统架构,然后,针对具有DAG偏序关系Job和Stage以及同一Stage中并行Task之间的问题特点和特征建立数学模型,并且以最小化最大完工时间为优化目标。最后提出基于异构Spark集群下的Task调度算法(STSA),该算法主要由以下四个部分组成:临时参数估计、Job序列动态调整、Stage调度、Task调度。在评估参数过程中通过前向递归计算和后向递归计算评估Job和Stage的相关临时参数。根据临时参数,提出两种Job排序规则,并基于三种Job排序规则来动态调整Job的序列。在Stage调度过程中提出了两种Stage权重设置规则,并根据Stage权重公平分配数据中心的计算资源。通过建立Max-Min双重堆为Task选择合适的Core运行,将Task调度后获得的调度系列作为Task初始序列,采用插入变邻域搜索方法对Task初始序列进一步优化。为了验证算法的有效性,采用多因素方差分析技术对算法所涉及到参数进行校正和分析。通过在不同应用程序规模和数据中心个数下将提出的算法和已有的算法进行比较分析。实验结果表明,所提出来的算法优于已有FIFO和FAIR调度算法。
其他文献
目的探讨低温等离子射频消融治疗慢性肥厚性鼻炎的围手术期护理,减少并发症发生。方法回顾性分析56例慢性肥厚性鼻炎患者行低温等离子射频消融治疗临床护理资料。结果术前加
目的探讨米索前列醇联合心理护理在绝经后妇女宫内节育环(IUD)取出的效果。方法选择门诊要求取IUD的绝经妇女208例,随机分为观察组和对照组,每组各104例,两组均在术前4-6h阴道后穹
发生在ICU内的心跳骤停患者如果能及时得到有效的CPCR技术的护理,将有利于保证患者的生命健康和生存质量,从而降低死亡率和致残率。因此,规范的CPCR护理程序的实施在ICU内是
【中图分类号】G623.2【文献标识码】A【文章编号】2095-3089(2015)17-0050-01 小学语文新课程的基本特点是工具性和人文性的和谐统一。文以载道,许多课文都蕴含了价值取向和价值认同方面的德育元素,语文教师不可能将德育元素从课文整体上分崩离析,“文道结合”传授核心价值观才是语文教师的不二选择。所以,小学语文课堂应注意教学内容的价值取向,渗透社会主义核心价值观体系的重要作用。那
从进入二十一世纪以来,国内计算机技术网络技术迅猛发展,企业对计算机技术和网络技术的应用也更加频繁,计算机技术和网络技术也给企业带来了更快的发展,而随着计算机技术和网
摘要:高职院校学生的心理健康与否是其大学生成长成才的关键问题,课题组通过对高职学生心理问题的问卷调查综合评定,最终得出高职学生心理危机的现实情况,为开展后期的心理辅导和教育提供了前期方案的数据统计工作,对探索高职院校学生开展高职学生心理健康教育的新方法提供了前提的平台。 关键词:高职学生 心理危机 现状 【分类号】B844.2 人才培养是教育的根本任务,在培养过程中培养人才的重要因素之一就是
油液在长时间使用后,会受到来自各方面的污染,其中,水的污染最为而且危害严重,轻则使得油液变质无法再使用,重则会损坏设备。水在油液中的存在形式可以分为三类,即游离水、乳