基于状态矩阵的Hadoop YARN节能调度策略的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:greenlandfun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算集群规模的快速扩张,其所带来的能量消耗和成本越来越巨大,不论从经济角度还是环保角度,如何降低集群的能量消耗,实现“绿色计算”,已经成为急需解决的问题,“绿色计算”也是当前云计算领域的一个研究热点。作为开源云计算平台系统中的佼佼者,Hadoop的应用变得越来越广泛,包括互联网、金融、医疗、零售等行业开始使用Hadoop。本文从实际角度出发,以集群资源调度策略作为切入点,针对Hadoop YARN系统,研究了基于状态矩阵的节能调度策略,并结合Hadoop YARN系统组成结构和实现原理,实现了一个YARN节能资源调度器。本文设计的节能资源调度策略主要有两个原则:(1)服务最优原则,即在资源调度时,其所选择的任务在对应节点应该能够获得较为高效的服务;(2)能耗最低原则,在保证服务的基础上,最终选择的任务应是所有任务中使得节点功耗最低的一个。为了满足以上两个调度原则,需要对集群各个节点的负载情况进行监控,为此本文构建了一个用于描述集群节点负载情况的状态矩阵,并以状态矩阵为基础,设计了负载预测模型对节点未来状态进行估算,设计了功率计算模型,根据负载状态对节点功率进行计算。在节能调度流程上,本文首先依据应用的资源使用特征对应用进行了聚类分析,具体的调度策略分为两个阶段:(1)根据节点的负载预测数据以及应用的资源使用特征,以服务最优原则选择适合在此节点运行的备选应用集;(2)依据能耗最低原则,在备选应用集中,依据功率计算模型,选择一个能够使节点功率最低的作为目标应用。在以上研究基础上,本文通过分析Hadoop YARN各个组件的功能以及调度器实现原理,将节能资源调度的各功能模块在原系统中进行了实现。通过对重新设计过的系统进行完全分布式部署测试,节能调度的资源监控、能耗计算、负载预测以及资源调度等主要功能均能正常工作。通过设计对比实验对节能调度器、FIFO Scheduler、Capacity Scheduler进行了比较,结果表明,节能调度器在保证了执行效率的基础上,在降低集群整体能耗方面有着一定效果。
其他文献
神经网络一直以来是实现分类器的重要方法之一.在多年的研究中,不同年代出现了几种有代表性的网络学习算法:如60年代的Widrow-Hoff神经网络学习算法;70年代的BP神经网络学习算法
视觉目标跟踪技术是计算机视觉领域中一个基础且重要的研究方向,在视频监控、自动驾驶、智慧交通、军事目标定位等诸多领域具有重大的研究意义和实际应用价值。基于跟踪任务
本文在分析高校就业管理业务的特点和发展趋势基础之上,将操作数据存储和OLAP技术应用到了高校就业管理与决策分析领域。通过对学生就业方面的各类数据从多个方面进行分析,找出
以并行计算为基础的高性能计算科学当前已经成为科学研究的第三大支柱。使用并行计算的首要因为是高性能高效率,而并行程序的首要条件是正确性。以往的设计和分析工具都只关
学位
语义Web服务自动组合技术是Web服务领域的研究重点和热点之一,这项技术的发展对网络中各种异构和分散的系统进行集成和交互具有重要意义和巨大的推动作用。本文将着重对此进
近来伴随互联网信息技术和产业链迅猛发展,各行业数据规模均呈现指数级增长,尤其以电商和社交网络为服务内容的企业数据中心。尽管数据量规模巨大,方便基本事务都有迹可循,但
粗糙集理论和证据理论都是处理不确定问题的重要工具。粗糙集理论处理不确定数据的优点在于不需要先验信息,在信息融合领域得到了广泛的应用。证据理论用基本可信度分配函数
数据挖掘技术在众多领域得到了广泛地应用。其中,在健康医疗领域产生的数据,数量巨大且形式复杂,无法通过传统的方法进行分析和处理。因此,本论文将尝试采用数据挖掘方法和技
随着Web成为世界上最大、类型最齐全的海量信息库,以企业运营分析决策为主的商务智能发展到了一个新的层次。Web作为商务智能系统至关重要的数据来源,但是Web数据在质量上还
阻抗成像技术是一种基于生物内部电阻抗分布的成像技术,属于无创生物检测技术的重要分支。因其无创性和早期诊断的优势成为目前生物医学领域的研究热点,其无损检测在工业检测