基于CPU-GPU异构架构下Cache优化技术的研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户：alwbgs

【摘要】

：

随着GPU和CPU的广泛应用,人们已经认识到这两个处理单元都具有其独特的功能和优势,GPU处理器不但具备3D图形渲染能力,它也可以实现基于大数据集上的密集计算。CPU处理器也兼

【作者】

：

刘士建

【出处】

：

北京工业大学

【发表日期】

：

2018年01期

【关键词】

：

异构多核 CPU-GPU 缓存划分缓存替换算法共享缓存

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着GPU和CPU的广泛应用,人们已经认识到这两个处理单元都具有其独特的功能和优势,GPU处理器不但具备3D图形渲染能力,它也可以实现基于大数据集上的密集计算。CPU处理器也兼具操作系统的运转和传统串行任务的执行两大特性。CPU结合GPU协同工作是实现高性能计算的必然趋势,计算机的发展也从传统的同构多核时代进入到异构多核时代。异构多核处理器将图形处理器(GPU)和通用CPU处理器整合到同一芯片上,通过片上网络进行通信和数据传输。这种异构结构对于CPU和GPU之间的资源共享,尤其是共享末级高速缓存(Last Level Cache,LLC)提出了新的挑战。GPU具备特殊的并行执行能力,拥有良好的访存延迟容忍性,LLC的很大一部分空间会被GPU应用程序所抢占,剩余非常有限的空间留给CPU应用程序,使得CPU应用程序的访存缺失率大大提高,降低CPU性能的同时也严重影响了异构系统的性能。因此,如何在保证GPU性能的前提下,尽可能减少GPU对共享缓存资源的不公平占用问题,已经成为目前亟需解决的问题。通过分析目前共享缓存管理技术的研究现状,关于缓存优化的两大关键技术,缓存划分和缓存替换算法主要应用于同构多核CPU系统中,基于CPU与GPU的访存差异性,面向CPU-GPU异构多核系统的缓存划分和缓存替换算法并没有得到深入的研究和发展。针对以上情况,为了提高异构环境下共享缓存的利用效率和系统性能,本文首先通过实验具体分析了CPU与GPU的访存行为差异,在此基础上提出了基于Cache划分的自适应替换算法。该算法首先采用划分策略,隔离CPU与GPU对于共享LLC的争用问题,之后根据消息请求访问类型的不同,采用不同的缓存替换算法进行替换。基于Cache划分的自适应替换算法结合了划分与替换算法两种管理技术,可以有效地提升系统的性能。针对静态划分中存在的局限性,进一步提出了基于GPU缺失感知的动态Cache划分算法。动态划分算法在运行时感知GPU缓存缺失率的变化情况,设置合理的阈值范围,在单位时间间隔内动态改变CPU与GPU对于共享LLC的缓存比例,在保证GPU性能的同时,提升CPU的缓存利用效率,从而使整体系统的性能得到进一步的提升。为了精准地评估实验方案对系统性能和功耗的影响,本文选取异构架构的Gem5-GPU模拟器作为基础实验平台,并通过集成McPAT和GPUWattch功耗模型进行功耗计算和统计,分别采用SPEC CPU2006和Rodinia作为CPU和GPU应用程序的测试集进行实验验证。实验结果表明,本文提出的基于Cache划分的自适应替换算法与传统的管理方案相比,CPU的性能得到了显著提升,最高提升33%,平均提升15%。基于GPU缺失感知的动态Cache划分算法在保证GPU性能不受影响的前提下,提升了CPU的性能,实现CPU在功耗仅仅增加2.3%的基础上,性能最高提升了17.3%,平均提升7.4%。GPU在性能不下降的前提下,功耗值降低了22.2%,最高降低50%。

其他文献

血清同型半胱氨酸水平对冠心病严重程度及支架置入治疗预后的影响

目的探讨血清同型半胱氨酸水平对冠心病患者病情严重以及支架置入预后的影响。方法选取2011至2015年心内科收治的冠心病患者90例,根据同型半胱氨酸（Hcy）是否在10μmol/L以上进

期刊

冠心病同型半胱氨酸严重程度支架置入预后

老庄哲学对语文教育的积极影响分析

老庄哲学在我国哲学史上主要是指以老子和庄子为代表的道家学说思想,道家学说强调无为而治、道法自然,它不仅是我国哲学发展史上一颗璀璨的明珠,而且也是我国传统文化中的绚

期刊

老庄哲学语文教育积极影响

个体叙事置换国家叙事的叙事策略分析——从顾筠的《缘聚羊城》探源奥运官方纪录片的历史沿承

<正>2011年广州亚运会官方纪录片《缘聚羊城》推出后,获得了国际体育界和电影界的广泛认同,在第29届米兰国际体育电影电视节上,获得了体育与社会类单元的桂冠奖以及当届电影

期刊

《缘聚羊城》叙事策略个体叙事国家叙事

创新开展游泳信息档案编研工作

<正>游泳信息档案对于挑战运动员的身体极限、发掘人的运动天赋和最大潜能,针对不同运动个体进行科学的训练,提高游泳运动员素质至关重要。借鉴国内及国外的成功经验,根据不

期刊

档案编研工作游泳运动编研成果编研选题

混凝土装配式住宅建筑施工技术探析

在房屋建筑工程施工的过程中,混凝土装配式住宅建筑施工技术是使用频率较高的技术,同时该技术也对房屋建筑工程的质量产生着直接的影响。本文主要分析了混凝土装配式住宅建筑

期刊

混凝土装配式住宅建筑施工技术

大前庭水管综合征患者多频听觉稳态反应的特点

目的通过对大前庭水管综合征（LVAS）患儿听觉多频稳态诱发反应（ASSR）测试分析,探讨其ASSR特点。方法对40例（80耳）听性脑干反应（ABR）最大刺激强度95dBnHL未引出波形极重度感音神经性耳

期刊

前庭水管/畸形儿童听觉丧失感音神经性

面向科技情报的互联网信息源自动发现技术

自动获取高质量互联网信息源是科技情报工作的一项基础性研究内容。以网站/网页类信息源和Twitter信息源为研究对象,基于共引关系以及关注关系和文本内容,分别提出了两类信息

期刊

科技情报互联网信息源Twitter共引社会网络分析

浅论电影中美术视觉造型的重要性

电影是兼有视觉艺术、听觉艺术特性于一身的一种视听艺术。电影美术是专门为影片造型进行设计和制作的一种美术创作。美术创作的成功与否,直接影响着影片的艺术水准。一部影

期刊

视觉艺术电影美术造型

基于大数据的玉米田四代棉铃虫发生量的预测模型

提出了一种基于支持向量机的预测模型。根据山东省1999-2013年玉米田第四代棉铃虫发生程度采集的数据,采用支持向量回归(SVR)算法,构建了玉米田第四代棉铃虫发生程度与其关联

期刊

农业大数据棉铃虫支持向量回归监测预警玉米

基于新型衍生化方法的UPLC-HRMS单克隆抗体N-糖基化分析方法

目的:为了满足单克隆抗体药物N-糖分析的实际需要,建立稳定、灵敏、可靠的单克隆抗体药物N-糖分析的分析方法。方法:采用全新的肼基衍生化试剂对N-糖进行衍生化,并对衍生化后

期刊

N-糖衍生化单克隆抗体肼基衍生化试剂糖基化糖蛋白液质联用二级质谱

基于CPU-GPU异构架构下Cache优化技术的研究

其他学术论文