LLVM循环向量化研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：y412327391

【摘要】

：

SIMD体系结构不断发展,其向量寄存器变得越来越长。如何在使用向量指令时利用更先进的SIMD单元获得更高的性能收益成了应用开发者和编译器实现者研究的重点内容之一。编译器

【作者】

：

黄亚斌

【出处】

：

国防科学技术大学

【发表日期】

：

2004年期

【关键词】

：

LLVM 循环向量化尾循环向量化掩码存取数据填充

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

SIMD体系结构不断发展,其向量寄存器变得越来越长。如何在使用向量指令时利用更先进的SIMD单元获得更高的性能收益成了应用开发者和编译器实现者研究的重点内容之一。编译器自动向量化是开发SIMD性能的重要途径之一。典型的产品化编译器都实现了自动向量化支持,随着SIMD体系结构的发展和编译优化技术的进步,编译器的自动向量化技术仍是学术研究和工程实现的热点。本文基于架构先进的LLVM编译器,针对更长向量长度的SIMD体系结构,研究循环向量化技术。LLVM循环向量化依赖编译器中许多其他的分析和优化,在向量化之前要分析程序的数据流和控制流信息、循环向量化合法性和向量化收益。此外为了使向量化时循环有统一的结构,还需要简化循环结构。LLVM向量化时为了获得更多ILP优化机会,会结合循环展开优化来实现。在循环体的标量指令中,只有部分指令能够向量化,剩下的指令只能标量执行,称这部分不能向量化指令为尾循环。本文通过对循环向量化时采取的操作进行分类,提出了基于掩码存取和数据填充方法,针对包含不同指令的尾循环进行向量化。在向量长度增长的情况下,尾循环向量化带来了性能收益。LLVM在处理循环向量化时,不能处理循环尾循环向量化,无法发挥硬件性能,也无法完全利用程序并行性。本文提出了尾循环向量化方法,能够很好解决尾循环无法向量化的问题,可以增强LLVM循环向量化能力,产生更高性能的目标代码。实验结果表明,尾循环向量化生成的代码比原来LLVM向量化生成代码具有更高的性能。在TSVC上测试最高加速比可以达到210%,在SPEC2006上测试可以获得最高5%性能收益。

其他文献

独立学院学生认同度调查研究——以广州大学华软学院为例

独立学院大学生思想政治工作的开展,既要符合一般大学生的思政教育培养规律,更应兼顾其群体的特殊性。笔者从独立学院大学生的归属感成因和影响归属感的因素探索着手,以广州

期刊

独立学院认同度学生

全面贯彻落实科学发展观加快建设社会主义新农村

建设社会主义新农村不仅关系到“三农”问题的根本解决，而且关系到国家的长治久安和民族的伟大复兴。我们一定要站在全局高度，统一思想，科学规划，扎实推进社会主义新农村建设，加快

期刊

社会主义新农村科学发展观“三农”问题小康社会目标新农村建设伟大复兴长治久安科学规划城乡关系

市委办公厅市政府办公厅关于进一步加强调查研究工作的若干意见

为进一步加强调查研究工作,更好地服务科学决策,推动工作落实,促进作风建设,特提出如下意见。一、切实把调研工作放到重要位置调查研究是谋事之基,成事之道,是我们党的优良传

期刊

调查研究工作市政府办公厅市委办公厅党的优良传统科学决策基本制度作风

基于无人机玉米出苗率估算与光谱特性的氮素诊断

基于无人机遥感作物长势监测与光谱特性的营养诊断技术研究,是现代农业生产实现过程化管理与数字化决策的重要手段,也是近年来智慧农业研究的热点。本研究针对宁夏滴灌玉米生长发育进程中存在的数字化信息获取手段单一、信息采集基础设施薄弱、田间动态管理不精准等问题进行研究与探讨。采用无人机获取玉米苗期田间数字图像信息,运用数字图像处理技术提取玉米出苗状况,建立基于无人机遥感的玉米出苗率预测模型;采用高光谱成像系

学位

玉米无人机出苗率高光谱机器学习氮素诊断

LLVM循环向量化研究

其他学术论文