论文部分内容阅读
随着超级计算机体系结构的不断演变,机群系统由于其卓越的性能价格比、良好的可扩展性、高可用性和好用性,逐渐成为当今计算机体系结构和并行处理研究的热点和主题。机群作业管理系统作为机群系统的一个重要组成部分,将系统的分散的资源整合起来,为用户提供了一个单一的系统映像,直接关系到机群性能的发挥和使用率的提高。它可以充分利用机群系统资源,有效管理机群,合理调度作业,因此,它成为许多机构研究的热点。本文在总结前人工作的基础上,首先系统地研究了机群作业管理的关键问题和具有代表性的机群作业管理系统,总结了机群作业管理系统的评价体系。然后从需求出发,提出了一种基于服务的机群作业管理系统,简要叙述了基于服务的机群作业管理系统的设计和实现。服务是一种包装后的实现了一定功能的组件。采用服务的设计思想,有利于在分布环境下实现应用的集成,使得基于服务的软件成员在分布异构环境中实现可重用、可移植和可互操作,而且能够提高系统的可扩展性。另外,本文还研究了当前流行的各种作业调度算法,设计并实现了一种简化的基于First-Fit的Backfilling调度算法RB-FIFT。实验证明,RB-FIFT调度策略不但能够消除系统中大作业的饥饿现象,而且也能提高系统的吞吐率。最后,本文总结了基于服务的机群作业管理系统和作者的工作,并对未来的工作做了展望。