论文部分内容阅读
经过近40年的发展,互联网已汇集了大量的资源,传统的并行计算系统由封闭的超级计算机向开放的网络计算系统发展,逐步演变为无处不在的网格计算平台。人们希望网格计算能够解决基因解读、星空模拟、大规模Internet仿真以及模拟核实验等重大挑战性问题。任务调度是影响网格环境下任务执行效率的重要因素,同时也是网格资源管理中最具有挑战性的问题之一,因此本文致力于此。 本文以网格任务调度技术为研究对象,分析网格计算环境对任务调度技术提出的新挑战,研究作业级(独立作业与并行作业)和应用级任务调度技术。本文首先明确了网格的起源与定义。然后,为了更好地理解网格计算,从不同角度对其进行分类,综述网格计算核心技术,并指出本文研究对象为计算网格。接着,深入剖析了网格任务调度技术当前研究进展和目前存在的问题,进一步明确本文任务调度的研究内容和研究对象。 针对作业级网格任务调度的信任增强问题,以独立作业为研究对象,量化作业与资源间不同信任关系下信任效益函数。对传统批作业调度算法进行信任扩展,提出了信任增强的独立作业调度算法。同时,考虑信任增强网格作业调度启发式的设计应重视资源与用户间的信任关系,提出基于信任关系的任务调度算法。该算法保证用户性能要求的同时兼顾信任需求。 针对作业级网格任务调度的多QoS约束及多目标优化问题,以独立作业为研究对象,通过引入多目标最优化理论及其演化算法,提出了一种解决多QoS约束的作业级任务调度算法。该算法求解多个QoS维度效用函数指标的非劣解集,尝试解决多管理域间网格用户、资源管理者等网格实体的多目标协同问题。 针对作业级网格任务调度的多址协同问题,以并行作业为研究对象,研究并行作业的多址任务调度框架与性能模型,提出多址任务协同调度算法。以最优和贪心资源选择策略为核心,提出两种作业级多址协同调度算法。多址协同算法框架由资源选择、资源预约和作业回填三个构成,可以保证较好的平均响应时间和机群利用率。此外,每个部分相对独立,易于集成相关研究工作。 针对应用级网格任务调度的负载平衡与任务划分,以同步迭代网格应用为研究对象,提出两阶段负载平衡算法:基于主机聚类预处理阶段、线性规划求解阶段。基于密度的计算网格主机聚类算法通过将具有较好网络性能的主机通过数据挖掘中的聚类方法聚合成簇,有效降低资源选择空间。线性规划阶段通过将同步迭代网格应用负载平衡问题映射为线性规划问题,在预处理阶段定义的资源空间内采用松弛因子法搜索近优映射方案。 在上述分析研究的基础上,建立了网格资源管理平台模型,提出了可以并发处理作业级与应用级任务调度的三层分布式网格任务调度体系结构,侧重解决网格固有的异构、站点自治与策略可扩展性。最后,通过一个应用级网格任务调度实例,给出网格域调度器的功能及网格调度的实施步骤及效果。