GPU并行技术在矩阵运算及正则模式分析中的应用

被引量 : 0次 | 上传用户:tangwang1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理器(GPU)是一种针对图形处理的专用处理器。近几年来,GPU的单精度峰值性能已经从每秒十亿次浮点运算(Gflops)增长到每秒万亿次浮点运算(Tflops)。随着其可编程性的不断发展,GPU开始越来越多地被应用到科学计算的加速研究中。GPU不但具有强大的并行计算能力,还具有低功耗、低成本的特点,是当今主流高性能计算系统的重要组成部分。如何将GPU的并行计算技术应用到更多的科学计算程序中成为了当今高性能计算领域研究的热点之一。本文利用GPU的可编程性和强大的多线程并行计算能力,作了以下研究工作:一、矩阵求逆是一种非常重要的矩阵运算,但是在CPU串行模式中计算大规模矩阵求逆过程是非常耗时的。本文根据GPU的硬件结构特点,在NVIDIA公司提供的CUDA(计算统一设备架构)平台上将矩阵求逆计算过程完全移植到GPU中,获得了300多倍的加速比,且单精度峰值性能达到了230 Gflops,从而满足了矩阵求逆在一些科学计算应用中对计算速度的要求。根据程序的执行结果,我们分析了GPU的单精度和双精度的浮点运算性能,同时分析了数据传输时间对GPU并行计算性能的影响,总结出适合GPU并行处理的算法特征,为GPU应用到更为复杂的分子模拟领域打下基础。二、正则模式分析(NMA)是预测蛋白质构象变化的有效方法,也是分子模拟中求解自由能采样最为耗时的部分。针对此方法中矩阵对角化部分计算量过大而导致计算时间过长的问题,本文利用GPU的并行处理技术对全原子NMA计算过程中的最耗时部分进行加速。结果表明GPU加速全原子NMA能够有效地降低矩阵对角化的运行时间,取得了20余倍的加速比,且单精度浮点运算峰值达到了180 Gflops,同时我们研究了单/双精度的改变对GPU计算性能和计算精确度的影响。
其他文献
目的研究莫西沙星注射剂的配伍问题。方法检索、分析近年来有关莫西沙星注射剂配伍禁忌的国内医药文献。结果莫西沙星注射剂与头孢唑林、头孢哌酮钠舒巴坦钠等多种抗菌药物、
目的分析江阴市2006—2013年累计报告新发尘肺病状况,探讨其发病特征,为尘肺防治工作提供科学依据。方法根据辖区内中国疾病预防控制中心"健康因素监测信息系统"的尘肺病报告
产学研联合培养研究生是提升研究生创新水平和实践能力以及高校高层次人才的综合素质和培养质量的重要途径。在对北京市产学研联合培养研究生的基本情况进行介绍的基础上,根
本文通过比较第五代导演和五四时期的知识分子,并且分析第五代导演的发展及其作品的特点,来考察80年代的启蒙运动。从内容上来说,80年代启运动与五四运动并不尽相同,但是当我
随着电视频道市场竞争的全球化进程逐步深化和中国电视频道收视市场化程度日益加剧,我国地方市级电视频道的市场竞争的烈度日趋白热化,电视频道间的竞争已经从传统意义上的节
鲍德里亚是当代著名的哲学家、社会学家,思想离经叛道,著作丰富深刻。鲍德里亚从未专门写过关于艺术的论著,但艺术一直是他密切关注的文化实践。作为一向游离于主流的思想家,
<正>《社会保险法》是保障和改善民生领域的又一部支架性法律,是新中国成立以来第一部社会保险制度的综合性法律。工伤保险待遇先行支付制度是《社会保险法》创设的重要制度,
宋代在词的发展史上处于十分重要的地位,是词发展的巅峰时期。宋代文人几乎都进行过词的创作,而山水田园词作为词创作题材的一部分,在词人的创作活动中占据了较为重要的一部分。
2007年下半年美国次贷危机爆发并逐渐演化为全球性的金融危机,美国许多银行倒闭破产,其中一个很重要的原因就是过分强调股东利益最大化造成绩效考核及经营的短期化,这对正处
随着知识经济时代的到来,现代科学技术快速发展,客户对产品差异化的需求越来越强烈,企业越来越依赖于高水平的研发能力获取市场份额和竞争优势。因此,现代企业对研发人员的需