论文部分内容阅读
MapReduce是由Google提出的一种编程模型,是一种处理大规模数据信息的计算模型和方法。本文主要研究MapReduce环境下的平行机调度问题,包括同类平行机的离线问题的最优算法和同型平行机的(半)在线的下界与在线算法。本文研究的模型主要考虑Map任务可分和Reduce任务可中断的情形,目标都是极小化最大完工时间。全文共分为五章。第一章主要介绍调度问题的相关概念与基础知识以及MapReduce调度问题的背景和研究现状。第二章主要研究同类平行机的MapReduce调度问题。针对三台机情形,通过分解所有实例的类型,给出了对任意速度下的可中断最优解算法。第三章主要研究m台同型平行机在线调度问题的下界。针对Map任务可分和Reduce任务可中断的情形,证明了任何算法求解该问题的竞争比至少为1.7135。第四章主要研究已知总和的两台同型平行机半在线调度问题。在已知Map任务和Reduce任务总和的情形下,无论Reduce任务是否可中断,证明了该问题的下界至少4/3,并给出了竞争比为4/3的最优半在线算法。第五章总结全文,提出了进一步的讨论与研究方向。