高性能计算云环境下GPU并行计算技术及应用研究

被引量 : 11次 | 上传用户:yanzhenwei2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,GPU(Graphics Processing Unit)并行计算技术已成为高性能计算(High Performance Computing,HPC)领域的研究热点。GPU硬件具有强大的浮点计算能力,为大型科学计算和工程计算问题提供了良好的支撑。目前,除了传统高性能计算应用以外,新兴高性能计算应用的需求也在增长。在用户服务方面,高性能计算面临着诸多问题:如何向用户提供灵活的服务模式,使用户能够自主管理计算资源;如何向用户提供可动态伸缩的计算资源,提升高性能计算设备的利用率。作为一种基于云计算的高性能计算资源管理和服务模式,高性能计算云能够解决传统高性能计算中所面临的用户服务方面的问题。高性能计算云和GPU并行计算是当前计算机应用技术的两个热点研究领域。这两个研究热点的结合部分是关于高性能计算云环境下GPU并行计算技术研究以及相关应用,但该部分的研究还处于起步阶段。云环境下GPU计算资源的调度管理,以及GPU计算通信的性能损失对高性能计算云中GPU并行计算技术的研究提出了极大的挑战。因此需要针对该类高性能计算云,开展GPU计算技术研究,从而为未来搭建基于GPU的大型高性能计算云平台以及为平台上GPU并行应用开发提供支持。针对高性能计算云环境下GPU并行计算技术,本文围绕高性能计算云环境下多GPU计算资源调度以及GPU计算通信展开深入的分析和研究,并在此基础上进行相关GPU并行计算技术的应用研究。本文研究工作以及研究成果主要有:1)提出一种在高性能计算云环境下多GPU计算资源调度机制。资源调度是云计算中的关键问题之一,GPU作为高性能云计算系统中的特殊计算资源,对GPU计算资源的调度有其特殊性。所提出的调度机制综合考虑计算任务在节点间以及节点内部的数据传输延迟,以充分利用系统GPU计算资源、掩藏传输延迟为目标,建立GPU计算资源模型。该模型有效地描述了高性能计算云环境下多GPU的“传输&传输&执行”三段调度过程。此外,该调度机制中还提出了一种树型结构的GPU资源分布式检索算法,以减轻中心节点的任务处理压力。实验结果表明该调度机制对均衡GPU资源,提高系统资源利用率和服务质量具有优势。2)提出一种在高性能计算云环境下GPU计算低延迟通信机制。配备GPU的高性能计算云需要满足支持多用户在线计算处理的需求的同时,减少因虚拟化带来的性能损失,实现GPU计算资源高效率的计算通信。所提出的通信机制采用数据保持的方法,将用户的GPU计算任务映射到主机端来计算,以减少虚拟机端与主机端的I/O数据通信,在一定程度上减少虚拟化所带来的性能损失,为用户提供高可扩展的计算服务。在此基础上,还提出一种数据复用策略来应对实时数据的处理需求,采用数据流传输的方式进一步降低实时数据的通信开销。实验结果表明了本章所提出的低延迟通信策略以及数据高复用策略的有效性,以及采用低延迟通信机制的高性能计算云平台具有可扩展性。3)作为高性能计算云环境下I/O密集型计算的应用,研究使用具有单指令多线程计算特性的GPU来对量子搜索算法仿真。提出了量子搜索算法在GPU高性能计算云平台上的仿真方法。其中一种方法针对量子搜索算法中的存储进行压缩,提高GPU内存的利用率,扩大了算法仿真的位数;另一种方法针对量子搜索算法的通用性仿真,解决了计算仿真时量子中间变量的运算、提取问题,使算法仿真更具有通用性。通过实验对比仿真效率以及分析所提出仿真方法的优缺点。4)作为高性能计算云环境下计算密集型的应用,研究原子级别分辨率的三维断层成像重构,并在GPU高性能计算云平台上高效实现。提出一种基于圆柱形傅立叶变换的三维重构算法。并在此基础上,提出基于GPU的非对称空间下的傅里叶变换高精度并行计算方法,优化非对称傅里叶变换中卷积步骤。采用输入驱动的方法有效地利用了GPU片上共享存储器,通过利用压缩数据集记录线程与输出数据对应关系避免数据写冲突。实验中结合已有关键步骤的计算方法,对比所提出的策略在单、双精度情况下的执行效率。最后,通过美国伊利诺伊大学香槟分校提供的实验数据,进行重构金原子纳米晶体三维结构,测试了重构方案在GPU高性能计算云平台上实现的可用性。
其他文献
目的探讨鼻饲并发症的预防性护理措施。方法对30例(3600例次)鼻饲采用传统方法(对照组)和改良鼻饲法(实验组)进行对照观察,比较两组鼻饲患者并发症的发生情况。结果两组患者呛咳发生
组合数学它在生活中的应用方面还有基础理论的方面都发挥着它越来越重要的作用。它不但在基础数学的研究中具有重要的地位,而且,在其他学科之中也有着非常重要的应用。比如在
后勤管理对于高校教学质量的提升、整体发展水平有着举足轻重的作用,是为学生学习专业知识、促进自身发展提供优良环境的有力保障。特别是伴随着信息技术发展的日新月异,使得
目的:观察应用乌司他汀联合生长抑素治疗重症急性胰腺炎的临床效果。方法:从我院2012年3月~2014年3月收治的重症急性胰腺炎患者中选取82例作为研究对象,随机分为观察组41例、
目的:探讨妈富隆与戊酸雌二醇治疗青春期功血的临床疗效与不良反应。方法:选取2013年2月~2015年3月来我院就诊的88例青春期功血患者,按不同治疗方式,随机分为妈富隆组(44例),
<正> 患者徐××,男性,41岁,干部。因左上后牙经常疼痛,于本月21日在余干镇卫生院口腔科行67拔除术。术后当天晚上10时左右拔牙创口开始出血,继而则大口吐出鲜红色血液约150m
<正> 湖山功放以其低价位、良好的性能和品质得到消费者的青睐。因其保护电路完备,维修有一定的难度,本文对社会拥有量较大的PSM—96型功放保护电路作一简单分析,供参考。一
模拟电子技术是较抽象的一门课程,很多知识点对于初学者来说有一定的难度,本文通过作者对模拟电子技术教学经验的总结,介绍了有关反馈放大电路中关于正、负反馈类型的判断方
<正> SS—5702型示波器为便携式双踪20MHz示波器,原是日本岩畸公司产品,引入国内后又作了改进,深受用户欢迎,在教学、科研及家电检修部门应用较广。其电路与普通型示波器(如S
无支架缆索吊装为拱桥施工的常用方法,其中主索为缆索吊装系统中的主要承重受力索,因此,在此系统中对于主索的精准计算就处于相当重要的地位。本文以梧州西江四桥工程为依托,