面向多核向量处理器的并行优化方法研究及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liyunlong1015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核化与向量化是高处理器性能的重要手段。并且被广泛应用在CPU与GPU的硬件优化上。多核向量处理器的编程需要依赖于并行编程方法论。本文综合考虑CPU与GPU共有的多核向量特性,重点研究面向多核向量处理器的并行优化方法。本文首先研究了多核向量处理器的结构特点、基于多核向量处理器的公共结构与通用并行编程方法,总结了面向多核向量处理器的并行程序设计模式;针对问题空间、算法结构、程序结构与实现机制四个层面上的设计模式,出了面向多核向量处理器的并行化方法,包括问题分析,算法结构设计,程序结构设计与实现四个步骤。在程序结构设计中,本文出了以循环为中转的多核向量并行策略,并总结了其他程序结构向循环转化的方法与循环在多核向量并行化中需要解决的问题。本文还根据多核向量处理器的共性出了两种优化方法,即存储模式优化与循环规整优化。本文将并行优化方法应用于数字图像关联分析(DIC)与基因数据比对这两种典型应用,以蒋震宇等人出的一种路径无关数字关联分析算法(PiDIC)与BWA-MEM算法做为两个应用领域的代表算法进行并行优化研究,分别设计并实现了cuDIC与vecMEM两种向量并行化算法。由于PiDIC显示出了细粒度规整的数据并行模式;而BWA-MEM中需反复使用的Smith Waterman运算的运行模式也较为规整,因此两种算法潜在可以进行多核向量优化。在算法设计中,本文针对DIC使用了较为简单的并行模式来保证每次并行调用的代价较低,在保证MEM的较合理的流水线外层算法结构的基础上进行算法结构调整;在程序设计中,使用了一系列以循环为中心的程序结构调整策略。分别基于GPU和CPU实现了多核向量并行优化的cuDIC和vecMEM。在多核向量并行化的基础上,还进行了存储模式优化,并针对执行模式较为复杂但是可预测的vecMEM进行了循环规整优化。实验显示,本文出的多核向量并行化及优化策略可以在一定程度上高程序性能。其中,cuDIC的速度为其串行等价PiDIC程序的19.62倍,而vecMEM的在100bp段序列的比对上执行性能相比于已进行多核优化的BWA-MEM高了30.6%。实验结果验证了本文所研究的面向多核向量处理器的并行优化的有效性。
其他文献
“常州三杰”之一,被叶剑英元帅赞誉为“青年模范,人民英雄”的恽代英,是中国早期进步知识分子的代表,恽代英倾其一生为中华民族独立富强而英勇奋斗,这与其较早树立正确的世
云计算技术是最近十年兴起的计算机热点之一,在普通消费者的日常使用中越来越广泛,但在大型企业中的应用确是相对的迟缓。本论文以S公司内部的IT架构变革作为研究背景,以S公
电阻抗层析成像技术(Electrical Impedance Tomography,简称EIT)是一种新型的医学成像技术,通过向人体表面的阵列电极注入极其微小的安全激励电流,测量人体体表的电压,并将测
针对传统光谱和距离感知传感器存在的空间视野小、距离感知分辨率低和光谱范围窄等缺点,本研究提出了大视场多光谱折反射成像系统的实现机理,并设计实现了系统原型。它在保持
北部湾经济区是我国新兴发展起来的西部沿海沿边的国家级经济区,涵盖广西壮族自治区首府南宁和三个沿海城市钦州、北海、防城港全部区域,并将与越南接壤的崇左及与广东相邻的
随着云计算的快速发展,云上的存储服务变得更加经济和便捷,人们能以十分低廉的成本将自己的数据上传至云存储。个人和企业考虑到效率和成本问题,越来越多的选择将数据外包给
复杂疾病又称为常见疾病,是目前困扰人类的主要疾病。跟单纯由基因决定的孟德尔遗传病不同,复杂疾病涉及到了环境因素、基因因素以及它们之间的相互作用等多种因素,病因十分
随着现代教学的发展,高校招生规模不断增大,教师群体数量的不断增多,高校的教学任务愈发繁重,同时教学质量也存在着越来越多的问题,比如监管力度不够,缺乏有效的教学质量评价
宽带蜂窝移动通信技术的飞速发展对蜂窝基站天线的小型化、高性能提出了更高的要求,表现为低轮廓,具备宽阻抗频带、低交叉极化、低反向辐射、具有稳定增益、3d B带宽和对称方
众所周知,笛卡尔哲学开端于对确定性的追求。笛卡尔哲学中提到的确定性有两种,即形而上学确定性(metaphysical certainty)和道德确定性(moral certainty)。但是围绕着道德确