悬浮颗粒模拟系统的GPU并行优化

来源 :南开大学 | 被引量 : 0次 | 上传用户:hamjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机模拟在当代化学、生物学、制药学以及流体力学等科学领域的研究中都扮演着不可替代的作用。通过对介观层面上的颗粒以及分子的模拟,可以大大地缩短这些科学研究方法的周期,同时极大地提高其实验成功率。在计算流体动力学中,时下最为流行的模拟方法就是通过计算机的计算,来实现对流体流向作用力等的数值模拟。计算流体动力学中,有一类重要方法是格子波尔兹曼方法(Lattice-Boltzmann Method)。  本文针对一款叫做Susp3d的对流体中的固体颗粒进行模拟的程序,为其设计GPU并行算法。通过时间复杂性分析和时间测量的方法,找到性能瓶颈,作为并行化的重点。通过链状数组、内存池、位压缩、快速归约求和、嵌套消除、宽度优先搜索、分块矩阵等策略,解决了Susp3d在密集计算、内存冗余、传输、申请及回收等方面的问题,把主要的计算步骤及数据读写从CPU和主存转移到了GPU和显存上。并通过MPI多节点模式,实现了多GPU的并行。  实验表明,通过GPU的加速,使得对于液体中悬浮粒子的模拟,可以得到CPU串行算法4倍的加速效果的同时,仍然保持计算结果的稳定性。另外,程序对于双精度浮点数的计算误差保持在10-6以下。
其他文献
数字水印技术是指利用人类的视觉系统(HVS)和人类听觉系统(HAS)的特性,用信号处理的方法在数字化多媒体数据中嵌入特殊的标记,通过对标记的识别可以判别所识别的数据是否合法。
本文在对数据挖掘技术及决策支持系统相关理论研究的基础上,依托金海岸信用决策系统的开发,将数据仓库、数据挖掘、联机分析处理、模型库等技术相结合,构建了一个综合性信用决策
门户网站被用作Web应用程序的简单统一访问点,此外还提供有价值的附加功能,例如安全性、搜索、协作以及工作流。门户网站提供集成的内容和应用程序以及一个统一的协作工作空
电子商务正在以爆炸性的速度发展,其最终目标是实现商务活动各环节的电子化。但是真正进行电子支付、开展电子交易的仍然比较少,电子商务的一个核心问题是支付问题,如何安全
本文基于Parlay/OSA的开放式业务架构和API接口,探讨了基于Parlay/OSA构建的下一代网络中业务生成环境(SCE)和业务逻辑执行环境(SLEE)的设计方法,并完成原形系统的设计,降低了生
近年来,随着全球信息化步伐的日益加快,计算机网络技术的发展与应用倍受社会各界的关注和重视,越来越多的企业,特别是大型企业建立了自己的计算机网络,以加强自身获取和处理信息的
随着我国气象部门信息化工程的建设和发展,各研究机构都建立了各自的信息处理系统,而这些信息系统却是在建立在不同的平台上,使用不同的语言进行开发的,数据库的模式也不尽相
互联网源于美国国防部的ARPANET计划。后来ARPANET与美国国家科学基金会州SF建成的NSFNET互联,并且开始了与加拿大、欧洲和太平洋地区的网络连接,这就是如今遍布全球的互联网的
电子商务系统服务质量的提高和营运成本的降低都离不开其性能的分析与优化。而现阶段对电子商务系统性能分析的研究大多偏于理论方面,且可操作性不强,分析模型单一。为给电子商
对象请求代理(Object Request Broker,ORB)是分布对象计算的心脏,它使得许多麻烦而易错的分布式编程任务得以自动化。ORB作为一个“软总线”来连接网络上的不同对象,提供对象