论文部分内容阅读
本文主要讨论了基于Linux的高性能计算集群上MPICH作业递交模式的研究和改进。
首先本文简单介绍了集群系统的一般概念。集群技术是国际上并行及分布式计算领域近年来比较活跃的研究课题。其中,很多并行技术都是在集群计算机系统上实现的。
随后本文介绍了高性能系统中比较常用到的网络技术,以及一些当前高性能计算机中使用和研究的通信模型和协议。
MPI并行计算系统是目前在高性能并行计算中使用最广泛的一种系统,对于该系统的研究也是一直十分热门。在各方面的研究领域中,尤其以并行计算性能的研究为重。并行计算性能的提高,一是提高计算的准确性,二是减少计算所需时间。其中,计算所需时间分为计算时间和通信时间。本文针对并行计算中的通信时间,介绍了MPI下的通信方式,并针对系统内部各节点之间的作业递交方式进行优化,以达到减少通信时间的目的。
MPICH是MPI的一种重要的实现,本文通过对MPICH作业递交方式的研究,提出一种新的作业递交方式即SBM方法,从而减少作业提交过程中通信的时间,得到更高的通信性能,实现对MPICH作业递交方式的改进,以适应大规模并行任务的需求。