面向GPU的循环合并

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:naocan528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的将C或Fortran程序映射到通用图形处理单元(GPU)的自动转换工具主要关注将单个循环生成一个独立的GPU内核,从而阻碍了对循环间数据重用的利用的问题,提出一种新的面向GPU的循环合并的代码变换方法,该方法通过循环分块(stripmining)和冗余计算等手段达到消除迭代间数据依赖的目的,并可充分利用GPU片上的共享内存进行线程间数据交换,从而将此类程序高效地映射到GPU上。通过典型程序在GPU上的实验表明,该新方法由于能够减少对全局内存的访问,带来了最多高达1.96倍的加速比。
其他文献
LNG汽车具有清洁、高效、经济的特点。以某LNG牵引车为目标车型,应用CRUISE软件建立LNG牵引汽车仿真模型,对其动力性和经济性进行了分析。然后应用正交试验对其变速器和主减
通过改变过量空气系数和加载电压,研究了点电极产生的正电场对甲烷-空气预混火焰形状、传播速率以及燃烧压力的影响.结果表明:在电场作用下,离子风效应促进火焰的传播,使火焰
采用非线性有限元分析方法对安全驾驶室翻车保护装置(ROPS)进行强度计算并对其进行可靠性分析。利用超椭球凸模型理论量化材料的弹性模量、泊松比、密度的不确定性。针对极限状
超前锚杆加固效果的准确评估及其合理的参数设计均依赖于对其加固机理的正确认识。为了说明土体与锚杆各项参数对锚杆加固效果的影响,建立锚杆-土体相互作用模型,以掌子面超
研究一种三自由度飞行模拟器运动平台的伺服电机参数预估方法,该运动平台由动平台、静平台以及二者之间的3条无约束主动支链和1条恰约束从动支链组成。提出了运动平台的恰约
企业为追求利益而采取的“漂绿营销”行为不仅是对消费者的欺骗,更扰乱了正常的市场秩序,对真正的绿色商品市场的正常运行造成了严重影响。为了促进市场经济的持续发展,我国
考虑到在汽车工程设计阶段优化气动性能的复杂性,本文选择在造型设计阶段对其进行气动性能优化。首先以整车模型中面云图验证二维纵向对称面模型CFD仿真分析的有效性,建立车
针对矿物浮选过程中获取的泡沫图像易受环境光照影响、噪声干扰和存在灰度对比度低等问题,提出一种结合多尺度Retinex(MSR)算法和非下采样Contourlet变换(NSCT)的泡沫图像增强方法
峭度和负熵是盲信号独立性的两个自然测度,可以被用来捕捉机械振动信号信息的动态变化特征,并提取机械设备的故障特征信息。峭度和负熵是从两个不同的角度和层面阐释机械设备
研究了黏弹性地基上变厚度矩形薄板的动力响应。采用分数阶微分的Kelvin-voigt模型描述地基的黏弹性特征,基于弹性板的基本假设,对于小变形问题,建立了黏弹性地基上变厚度矩