【摘 要】
:
随着通用图形处理器(GPGPU)计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有着重要影响。本文依托英伟达公司计算统一设备架构(NVIDIA CUDA)技术平台,以GRAPES全球模式中长波辐射传输方案为例
论文部分内容阅读
随着通用图形处理器(GPGPU)计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有着重要影响。本文依托英伟达公司计算统一设备架构(NVIDIA CUDA)技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,针对程序特点设计出的不同于MPI粗粒度并行的线程级细粒度并行方案,分别在Tesla C1060显卡和Tesla C2050显卡上作了对比试验。对比MPI粗粒度并行方案,线程级细粒度并行方案的优点主要有以下三点:a)并发度增加。b)充分利用大的显存带宽。c)计算和通信密度增加,提升效率。GPGPU的计算能力具有针对性,具有以下特点:大量的平行数据与计算,较少的逻辑分支判断等。这些计算特点与数值天气预报模式数据密集,计算量大、且高度并行的特点相吻合。因此,将GPGPU技术运用于数值天气预报模式的运行中是可行的。初步试验结果显示,在保持系统结果一致的前提下,如果只计算GPGPU的计算用时,对比单颗高端CPU,Tesla C1060GPGPU具有11倍的加速效果;Tesla C2050GPGPU具有13倍的加速效果。而如果计算数据传输和GPGPU计算总耗时的话,Tesla C1060GPGPU和Tesla C2050GPGPU的总加速分别为5.9和6.1倍。对并行结果做深入分析后发现,基于通用图形处理器的多线程并行在不超过硬件限制的条件下,线程数量越多,速度越快,增加模式的并发度与GPGPU系统的占用率有利于发挥GPGPU的性能。基于通用图形处理器的GRAPES全球模式中长波辐射并行方案有良好的加速效果,但通过分析发现CPU与GPGPU间的数据传输耗时非常大,会消耗由通用图形处理器的计算能力带来的优势,是GPGPU并行试验中的最大瓶颈。最后针对程序特点,采用异步执行方法来隐藏数据传输延迟。异步执行允许GPGPU的操作(内核启动或者异步存储器拷贝函数)从CPU端启动后,在GPU真正完成这些操作之前,在CPU端就可以得到这些函数的返回值,CPU线程就可以继续下一步操作。通过异步函数,CPU可以在GPGPU端进行运算或者数据传输的同时进行其他操作,更加有效地利用系统中的计算资源。本试验中运用多个流的异步执行方法来隐藏数据传输用时的方案取得了可观的加速效果,最后的总加速是原模式CPU方案的8.97倍,明显提升了GRAPES全球模式的执行速度和预报时效。本研究表明,使用GPGPU技术提升数值预报模式的执行速度是可行的,也是非常有潜力的。
其他文献
荒漠草原是典型草原向荒漠过渡的一类草原,研究荒漠草原地表-大气之间的相互作用对认识稀疏植被下垫面对大气的反馈作用,进而了解其在气候变化中的作用至关重要。地表反照率影响着地表对太阳辐射的吸收,直接控制了太阳辐射能在地表和大气之间的分配,是大气和陆面模式的重要参数。地表反照率取值的合理程度决定了数值模式计算中地面加热作用的准确程度。本论文针对当前中尺度模式中陆面参数化方案对稀疏植被考虑的不足,以荒漠草
由于模式的分辨率有限,不能被模式分辨的地形称为次网格尺度地形,次网格尺度地形在热力和动力方面对实际大气有着不可忽略的作用,其效应只能通过参数化的形式回馈给模式。本研究主要针对次网格尺度地形的动力过程参数化,一般而言,次网格尺度地形的动力作用主要包括:(1)湍流过山引起的次网格尺度湍流地形拖曳力;(2)次网格尺度地形对气流的阻挡、分流并在背风坡形成背风涡引起的阻挡(分流背风涡)地形拖曳力;(3)气流
利用CAMS中尺度云分辨模式对2008年3月20日华北地区层状云系降水个例进行自然降水模拟,分析微物理和动力、热力特点,并在模拟结果与实测结果较为一致的基础上进行人工引晶催化试验,设计不同剂量、高度的催化方案,对效果进行分析,选择合适的时机和区域,对比播撒前后各微物理量的时间和空间分布变化,分析源汇项变化。CAMS中尺度云分辨模式中增加了粒子数浓度的预报模拟,适合进行人工引晶催化试验。此次降水过程
利用1979–2011年美国NCEP/NCAR和日本JRA–25月平均再分析资料,并采用EOF分析方法,本文分析了近30年来东亚冬季地表气温的变化特征。同时利用1979–2011年美国NCEP/NCAR逐日再分析资料,揭示了东亚冬季气温季节内变化规律及极端气温事件频次的变化特征。并在此基础上着重探讨了东亚冬季气温与同期大气环流和前期秋季外强迫(海温、海冰和积雪等)因子异常之间的可能联系。得到的主要
本文用理想数值模拟分析的方法,在MM5模式中构造对称初始涡旋,在理想的环境场中发展为成熟的TC并移动经过从台湾岛抽象出的岛屿地形,揭示岛屿对TC强度和结构影响的机理。结果表明,在有背景气流和固定SST的情况下,用一个相对较弱的气旋性涡旋作为模式的初始场,得到的TC的强度、结构等各项特征指标,与实测和已有成熟研究结果基本相符,理想模拟试验的方法对TC强度及结构变化的模拟具有很好的可靠性和客观性; T
自从多普勒雷达被应用于气象观测和研究以来,高时空分辨率的多普勒雷达资料应用一直深受人们重视。对于雷达径向风资料的应用,早期主要是通过时空连续性假设在一定约束下反演风场,以便于天气分析诊断。随着数值预报模式的发展,雷达径向风的同化应用发展很快。单多普勒雷达径向速度资料同化主要有两种方法:一是直接同化,二是反演同化。在直接同化和反演同化基础上,本研究提出了一种新的改进同化方法,改进同化方法通过引入反演
针对风电场建设要求,本文利用加拿大的非线性高分辨率数值模式NLMSFD(Non-linear Mixed Spectral Finite Difference Model)尝试对山东荣成地区风资源进行评估。在试验区域内,分别选取两座测风塔不同高度上一年的月平均风速观测资料作为驱动值,利用模式对试验区的风速分布进行了模拟试验,获取了试验区100m×100m分辨率的风资源分布情况,评价了NLMSFD模
选取07年16号台风“罗莎”作为个例,利用耦合了双参数混合相云降水物理方案的GRAPES中尺度模式对其进行了模拟,并结合实况雨量、雷达及卫星资料分析了本次台风暴雨的结构及云微物理特征。分析结果表明,低空急流和不稳定的温度层结为本次降水过程提供了有利的天气条件。强降水中心主要出现在台风云系的北部和东部,在模拟时段内6小时累积降水最大值超过100mm。积分固态水含量与液态水相当,说明冰相粒子在形成降水
随着数值天气预报和计算机技术的迅速发展,数值天气预报模式的分辨率也越来越高,但模式的有限网格尺度始终不能显式分辨大气中存在的所有尺度。由于湍流运动经常活跃在比模式的水平网格更小的尺度上,因而为描述这些次网格物理过程的作用,参数化的处理方式依然十分重要。换句话说就是将次网格过程使用包含可分辨的网格尺度变量的公式来表示。行星边界层代表了地表与模式最底层之间热量、动量和水汽的湍流输送,因此边界层直接影响