【摘 要】
:
随着互联网技术的不断发展,面对空前膨胀的海量数据,云计算得到了快速发展。在云计算中,MapReduce分布式计算框架已经成为目前流行的处理大数据的计算模型。为了保证MapReduc
论文部分内容阅读
随着互联网技术的不断发展,面对空前膨胀的海量数据,云计算得到了快速发展。在云计算中,MapReduce分布式计算框架已经成为目前流行的处理大数据的计算模型。为了保证MapReduce的执行性能,目前针对于MapReduce作业资源分配的问题已经开展了大量的研究工作,不同的数据放置方法、作业调度顺序和资源分配策略,MapReduce作业将具有不同的执行性能。本文分析了目前MapReduce作业调度工作的研究现状,针对MapReduce中资源调度方法存在的系统吞吐量和资源利用率低的问题,提出了一个细粒度的MapReduce资源分配方法。该方法包括细粒度的MapReduce作业的资源初始分配和动态重分配两个部分。JobTracker是运行MapReduce应用过程中的主控节点,它控制着作业执行的顺序以及计算资源的分配,TaskTr acker受J obTr acker的控制,执行被划分成任务的作业。首先,在该框架中,针对Hadoop中“Slot”静态配置,导致Hadoop集群的资源利用率不高的问题,将Map Slot和Reduce Slot用Job Slot代替,分配资源时为作业选择合适的计算资源即合适的Slot,提高资源的利用率。其次,针对缺乏对多MapReduce作业全局性能的保证而导致Hadoop集群吞吐量低的问题,定义作业完成度的概念,并通过最大化作业完成度和利用率,以提高集群的吞吐量和利用率为目标,提出初始资源分配算法。再次,针对无法捕捉MapReduce作业对资源的动态需求的变化而导致作业性能下降、资源利用率不高的问题,定义资源需求变化事件,通过该事件感知资源需求变化,并在此基础上,提出资源重分配算法,为作业重新分配Slot,保证系统的吞吐量和资源利用率。本文在以上研究基础上,搭建了一个分布式的Hadoop集群实验环境,通过对比实验,对实验结果进行了分析,验证了本文所提出的云计算环境中细粒度的MapReduce作业资源分配方法的可行性和有效性。
其他文献
炎症是人类许多重大疾病的基础性疾病,控制炎症的发展具有重要的意义。中性粒细胞(Neutrophils)是人体先天免疫的重要组成部分,在调节炎症和免疫应答的过程中发挥着重要作用,是引发人类炎症性疾病的重要炎症细胞。在炎症刺激下,中性粒细胞离开血液后,受到细胞因子、生长因子和可能延长中性粒细胞寿命的病原体产物等许多刺激物的刺激,使得中性粒细胞被激活。受到这种病原体刺激的中性粒细胞寿命延长,这可能有助于
隐性经济在世界各国普遍存在,我国的隐性经济规模也不容忽视,相关研究表明,近年来,我国隐性经济规模占GDP的比重在10%~20%之间,其绝对规模仍然较大。隐性经济对国家和地区的
面对如今迅速发展和广泛应用的无线通信技术,如何更大程度的加快信息传输速率、保证数据信息传输更加可靠成为了如今急需解决的一个难题。物理层网络编码(Physical-Layer Net
随着生产力的不断发展和自动化技术的普及,机械臂已经被广泛应用于工业制造、医疗服务、军事以及太空探索等领域。因此,机械臂控制技术的研究也引起了广大学者的普遍关注。由
X射线发光断层成像(X-ray Luminescence Computed Tomography,XLCT)是采集成像机体中目标被X射线激发后产生的光学数据,并结合重建方法获取目标信息的一种重要的分子影像技术
进入21世纪,互联网进入了一个快速发展的时期,其与我们的日常生活息息相关。人们在互联网上获取信息方便、高效。但是,互联网在方便我们的同时,暴露出来的安全问题也十分重大
随着科学技术的快速发展以及对多智能体系统研究的不断深入,编队控制作为多智能体系统研究中的重要组成部分受到学者的持续广泛关注,大量好的研究成果不断涌现,并且一些成果
农业适度规模化经营能够促进农业的分工分业与农业专业化发展,是引领农业提质增效、提升农业竞争力的发展要求。西北五省(区)农业是典型的旱塬区农业,研究其农业规模经营效率
随着科学技术的不断发展,我国的经济水平也逐渐提升,纳税人数大幅上升、生产经营方式也逐渐复杂,而与之对应的税务机关工作人员较少,加上税收业务管理自身的困难些和复杂性,
随着信息化社会的飞速发展,高性能计算已经成为继理论科学和实验科学之后科学研究的第三大支柱。从战略高度方面讲,高性能计算技术是一个国家综合国力的表现,在国防安全、高