【摘 要】
:
近年来,云计算技术发展迅速,已经成为成IT产业发展的一个主流方向。Map Reduce是一个广泛应用于分布式计算环境中的编程模型。由于Map Reduce模型中Map与Reduce阶段的同步过
论文部分内容阅读
近年来,云计算技术发展迅速,已经成为成IT产业发展的一个主流方向。Map Reduce是一个广泛应用于分布式计算环境中的编程模型。由于Map Reduce模型中Map与Reduce阶段的同步过程可能会导致长尾问题,使得部分计算节点即使在非常好的调度算法下,其资源利用率依然会降低。Map Reduce中现有的调度方法主要针对作业层次,任务层次的调度也仅在发现慢节点后采取事后补救措施。现有调度方法将计算节点作为同质的。事实上,考虑节点之间的差异性,能够获得更好的任务调度结果,并改善长尾问题的发生。本文分析了产生长尾问题产生的根本原因,即半失效节点的存在,并提出了一种分布式节点半失效检测方法来检测这些半失效节点。我们通过节点之间的交互过程,用以获取节点执行任务情况并评估节点的计算能力。根据节点的计算能力,我们基于奈尔检验法设计了一种针对节点的评估方法。最后根据节点的评估值,有针对性的筛选出半失效节点。本文根据对节点计算能力的评估,提出了基于节点性能的任务调度优化方法。我们在作业进行的过程当中,根据节点已执行的任务情况预测节点后续的工作能力,并提前预计在最优调度情况下的作业完成时间。根据作业完成时间的确定,我们将剩余任务在计算节点之间根据计算能力进行分配。通过模拟实验,减少了长尾问题的发生,提升了集群的资源利用率,减少了作业完成时间。
其他文献
随着医疗信息技术的进一步发展、数字化医疗的逐渐普及,作为医学图像存储与传输标准的DICOM越来越受到医学界的重视。医学图像数据量巨大,对存储设备和传输设备的性能都提出了
近年来,计算机网络的迅速发展使得越来越多的信息被数据化。传统的存储系统已经不能满足企业对存储系统高可靠性,可扩展性和安全性的要求。在这种情况下,出现了存储区域网络(
嵌入式系统一般指非PC系统,包括硬件和软件两部分。硬件包括微处理器、存储器及I/O端口等。软件部分包括应用程序和嵌入式操作系统(EOS)。嵌入式操作系统一般要求实时和多任
随着基因测序技术和人类基因组计划的发展,人类已获得了大量的生物序列数据,并且其积累速度还在飞速增长。生物信息学作为一个新兴学科,对如何利用信息技术来分析生物数据,提供了
随着网络传真技术和OCR技术的发展,网络传真智能监测系统的研究有着广泛的应用价值和理论意义.而作为该系统关键技术部分的传真图像恢复,对于提高传真OCR识别率、丰富图像恢
XML是可扩展标记语言的简称,它为Web上的结构化文档和数据提供了通用的格式。随着Internet的发展尤其是Web技术的广泛应用,越来越多的应用采用了XML技术作为信息表示和数据交换
关联规则挖掘是数据挖掘领域中一个重要的研究方向。为了解决数量型关联规则挖掘过程中“边界划分过硬”的问题,人们将模糊集的有关概念引入到关联规则挖掘中,提出了“模糊关
本文主要研究了模式驱动 J2EE 应用的软件设计方法。首先介绍了设计模式和J2EE 技术,然后对典型 J2EE 设计模式展开论述,对于这些设计模式,本文分析了它们的产生背景、基本原
本文首先介绍了并行编程的背景、以及并行编程面临的问题。然后提出一个并行化模型--基于元任务的用户引导的串行程序并行化模型(Metaparallel),经由并行化模型产生的并行程序能
经济全球化带来了机遇也带来了挑战。价格因素作为主导消费市场的主要因素,一直是影响企业竞争策略的重要方面。利用那些对价格波动产生影响的因素所表现出的信息,结合市场价