论文部分内容阅读
并行AMG法是求解偏微分方程离散化系统最为有效的迭代法之一.CPU+GPU异构计算机已成为高性能计算机发展的重要趋势,MPI/OpenMP+CUDA是能充分发挥高性能异构计算机有效峰值的主要并行编程环境.目前面向异构计算机系统的并行AMG法及其实现技术,还有许多值得研究的问题,本文的工作主要有以下两个部分: 第一部分针对一类系数矩阵为稀疏带状结构的线性代数方程组,在OpenMP并行编程环境下,对HYPRE中默认的AMG(BoomerAMG)解法器内的并行插值算子和并行粗网格算子的生成模块进行了改进.通过给出这两个模块中相应辅助数组的有效长度及偏移量的估计式,得到了具有更少内存开销的辅助数组及其计算公式,并研制了相应的程序模块.数值实验结果表明,改进的BoomerAMG解法器提高了原解法器的求解能力和并行计算效率. 第二部分针对CPU和GPU不同的工作特点,研究了几种常用的UA-AMG法及其应用,具体表现为: 关于CPU下的串行UA-AMG法,基于VMB聚集法,通过结合几种常用的Cycle和利用转换算子的特性,给出了具有更低运算复杂性的UA-AMG法,研制了相应的程序模块,并将以这些UA-AMG法为预条件子的PCG法应用于二维单温辐射扩散模型问题.数值实验结果表明,UA-NA-CG-s法最为稳健高效,且比目前国际上已有的HYPRE、AGMG以及Cusp软件包中常用的基于AMG预条件子的PCG法具有更高的计算效率. 关于GPU下的并行UA-AMG法,基于MIS(2)聚集法和带权Jacobi磨光算法,给出了具有更低运算复杂性的UA-AMG法,研制了相应的程序模块,并将以这些UA-AMG法为预条件子的PCG法应用于二维单温辐射扩散模型问题.数值实验结果表明,UA-W-CG-p法最为稳健高效,且比Cusp软件包中基于SA-AMG预条件子的PCG法更为高效.在此基础上,结合几种结构网格下的红黑序Gauss-Seidel磨光算法研究了相应的UA-AMG法,并将其对应的PCG法应用于上述模型问题.数值实验结果表明,这些PCG法也是稳健的,且并行计算效率更高。