【摘 要】
:
近十年来,随着可编程性和计算能力的不断提升,GPU的应用范围已扩展至通用计算领域。众多通用计算GPU程序中包含访存不规则性。访存不规则性阻碍了GPU缓存对线程束内和线程束
论文部分内容阅读
近十年来,随着可编程性和计算能力的不断提升,GPU的应用范围已扩展至通用计算领域。众多通用计算GPU程序中包含访存不规则性。访存不规则性阻碍了GPU缓存对线程束内和线程束间数据局部性的捕获,使得程序执行速度低下。研究人员对GPU微架构进行了大量改进,以保护GPU程序中的数据局部性。但现有技术尚不能有效保护访存不规则程序中的线程束间数据局部性。为此,本文设计了基于线程重组的线程束间数据局部性保护方案。本文首先介绍了该线程重组方案包含的两项技术措施:(1)在线程束之间交换线程以避免线程束间的缓存竞争、保护数据局部性;(2)对访存流进行调整,以降低访存延时并提升访存不规则程序性能。接着,本文阐述了实现上述技术措施所需的GPU微架构修改,即引入重组缓冲区和修改发射逻辑。随后,本文分析了线程重组的性能开销,并讨论了减少开销的具体措施。最后,本文结合线程重组和一项线程束内数据局部性保护技术MRPB,设计了兼顾线程束间和线程束内数据局部性的综合方案。该微架构方案在GPU程序执行初期对其进行访存特征分析,根据程序特征分别采用线程重组和MRPB技术保护不同类型的数据局部性。本文在仿真平台GPGPU-Sim上分别实现了线程重组方案和综合方案,并使用以访存不规则程序为主的GPGPU测试集PolyBench对两者进行了验证。实验结果表明,与基准架构相比,线程重组方案使得一级缓存缺失平均减少28.2%,IPC平均提升44.9%。上述结果表明,本文设计的线程重组方案可以有效保护数据局部性,提升访存不规则程序的执行速度。此外,综合方案使得一级缓存缺失平均减少34.9%,IPC平均提升63.2%,这表明综合方案在线程重组方案基础上进一步保护了数据局部性,并提升了程序执行速度。
其他文献
房屋改造需要经常采用加固处理施工技术,提高房屋的使用功能和抗震性,满足人们对房屋使用的要求.本文对老旧房屋加固策略进行论述,并对常用的老旧房屋维修加固技术进行分析,
现代医学科学正处于高速发展阶段,各专业先进医疗设备、先进技术不断应用.这势必对医疗设施提出了更专业、更精细的专业技术要求,需要有与之相适应的现代化医疗设施.因此在设
本文在对小型水库标准化管理长效机制构建与实施的重要意义分析基础上,结合当前我国小型水库标准化管理的现状和问题,对促进小型水库标准化管理长效机制构建的具体措施进行研
石墨烯是一种由碳原子以Sp2杂化轨道组成的六角型晶格单原子层二维晶体。有许多独特的性质,它是零带隙的半金属半导体材料,具有优异的电导率、良好的载流子迁移率、很高的热导率、超高的比表面积以及优异的力学性能,这些独特的优势使得石墨烯具有良好的场发射性质。场致发射是冷阴极电子发射。场发射阴极具有大电流、低功耗和冷发射的特点,有着广阔的应用前景。石墨烯具有众多独特的优势,使其成为理想的场发射阴极材料。但是
本文针对新冠状肺炎影响下暴露出的建筑环境问题展开分析,结合新冠状肺炎影响下建筑环境的预防措施,包括借助“水封”阻断病毒传播、改善循环式空调系统、将垃圾通道进行封闭
当前,我国医疗卫生服务水平逐步提高,直线加速器的应用极为普遍,其应用提升了医院的放射治疗水平.与一般的治疗方式相比,这种放射治疗对于治疗环境的要求相对较高,因此,各大
中央控制室的功能很多,其中,中央控制室的温度控制系统对整个工厂控制系统有着十分重要的作用,重视中央控制室温度控制系统设计,促进工厂控制系统不断提高和发展,有利于使整
随着近年来因特网的迅猛发展和更多网络应用的迅速推广,人们越来不满足于传统网络设备的处理能力。因此,专门用于处理网络数据的专用网络处理器应运而生。网络处理器是一种可
建筑行业的蓬勃发展带动了市场经济的快速推进,为我国国民经济建设奠定了坚实的基础.由于地域环境不同、施工人员素质参差不齐、工程材料管控出现漏洞等情况的不断出现,严重