GPU程序的二进制翻译关键技术研究

被引量 : 4次 | 上传用户:waxizhaojing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二进制翻译技术能够在没有源代码的情况下,把源机器的二进制程序移植到目标机器上运行,不仅能够有效解决软硬件兼容问题,在信息安全领域也有重要应用,还对自主设计国产处理器和计算机系统具有重大意义。然而,传统的二进制翻译技术研究仅仅局限于单核架构处理器,随着众核处理器在市场上的需求与占有量越来越大,新型架构计算机系统使二进制翻译领域面临新的挑战。在深入剖析CUDA异构并行计算架构特点的基础上,本文对异构并行架构处理器之间的二进制翻译技术展开研究,提出了针对异构并行架构的二进制翻译框架和线程映射、存储器映射及强制同步算法等技术与算法。本文的主要工作和创新点有:1)针对传统的二进制翻译框架无法适应新型体系架构的需求,提出了CUDA程序的静态二进制翻译框架,实现了面向众核处理器的二进制翻译系统。翻译框架采用分而治之的思想,分别调用不同的翻译器将CUDA程序的CPU代码和GPU代码翻译到目标平台的主核和从核阵列上,然后对GPU程序的二进制翻译关键技术展开研究,设计实现了NVIDIA GPU到某国产众核处理器的二进制翻译原型系统GPUtoM(GPU to Many-core)。2)针对众核处理器之间并行粒度、线程层次的巨大差异,提出众核处理器之间层次化的线程映射模型。该模型首先将GPU程序的Kernel函数映射到目标平台从核阵列的各个从核上,然后从核线程依次循环执行CTA中的细粒度GPU线程。3)针对CTA允许内部线程进行栅栏同步的问题,提出了一种基于线程循环结构的强制同步算法。该算法在不改变CTA栅栏同步语义的基础上,首先删除PTX代码中的同步指令,然后以同步点为界将PTX程序分割为两个子程序段,并保护各线程执行环境,最后将各子程序置于线程循环结构中执行。4)针对众核处理器存储器结构复杂,特殊存储器丰富,不同系统之间存储器层次差异巨大的问题,从生成代码的正确性和高效性出发,提出多层次存储器的映射模型,并完成了NVIDIAGPU到某国产处理器的存储器映射。本文在提出GPU程序二进制翻译过程中的若干关键技术之后,阐述了GPU程序二进制翻译原型系统GPUtoM的设计与实现过程,最后采用Test-gpu、CUDA SDK和Parboil等测试集对GPUtoM及相关技术进行测试,测试结果验证了本文提出的技术与方法的正确性和有效性。
其他文献
本文以直立百部(Stemonasessilifolia (Miq.) Miq为研究对象,在文献研究的基础上对其进行了化学成分研究、质量标准研究、总生物碱提取纯化工艺研究等内容,目的在于建立直立
农产品加工企业人才流失问题是制约我国农产品加工业发展的重要问题,在农产品加工企业的发展过程中如何保障人才是时代赋予我们的新的历史使命,是一项艰巨而又紧迫的任务。我
约翰·麦克斯韦尔·库切(John Maxwell Coetzee,1940-)是南非当代著名作家,2003年获诺贝尔文学奖。库切是一位精于小说技巧的作家,他对现实主义、现代主义和后现代主义的小说
美国的著名经济学家、诺贝尔经济学奖得主约瑟夫·斯蒂格利茨曾断言:在21世纪,有两件事能够引起世界面貌的改变和促进人类的发展进程,第一是美国与欧洲国家的高科技革命;第二是
随着计算机技术的不断发展和信息管理系统在技术上不断成熟,越来越多的企业和组织都开始在不同层次上引入信息管理系统来实现信息化管理。公安局的人事管理过程中产生的信息是
以江苏省生祠镇为例,首先对其乡村旅游资源的开发进行了可行性分析,进而提出了生祠镇乡村旅游规划的整体思路,制订了生祠镇乡村旅游开发的功能布局方案,将生祠镇的乡村旅游开
油茶(Camellin oleifera)是我国特有的木本食用油料树种,在我国经济林产业发展中占据重要地位。目前,我国共有油茶林约5000万亩。据统计,油茶低产林面积占油茶总面积的80%-90
<正> 溶菌酶是一种用途较为广泛的生化物质,强碱性蛋白酶,等电点高,分子量低。由于能催化格兰氏阳性细菌细胞壁粘多糖的水解,因而在医学上是一种有效的抗菌剂。鸡蛋的蛋清中
莫里斯·梅特林克是1911年诺贝尔奖获得者。他的戏剧创作,尤其是早期剧作,在西方戏剧史上具有非凡的革新意义,其独特的戏剧观和戏剧形式使得影响了后世很多现代派戏剧作家。本文