论文部分内容阅读
随着高性能计算(High-Performance Computing,HPC)系统规模不断增长、性能不断提高,系统功耗问题也日益凸显。巨大的系统功耗不仅增加系统电力开销和运行成本,而且间接加剧碳排放及其对环境的压力,严重影响计算系统的性能扩展。在该背景下,绿色计算(Green Computing)受到越来越多的关注,高能效(Energy Efficiency)设计,也成为高性能计算系统的首要设计需求之一。另一方面,众核(Many-core)体系结构在高性能计算领域扮演着越来越重要的角色,不仅为高性能计算系统提供了强大的计算能力,同时也消耗了大部分系统功耗。因此,研究众核系统的动态能耗管理技术(Dynamic Power Management,DPM),降低众核芯片的功耗、提高其能效,对于提高整个计算系统的能效具有重要作用。针对众核体系结构的新特点及其能耗管理的迫切需求,本文研究了众核体系结构的功耗模型,结合功耗模型及性能模型,探索了可扩展众核系统能耗管理技术,并研究了针对众核的高效动态电压频率调节技术(Dynamic Voltage and Frequency Scaling,DVFS)。取得的主要研究成果如下:(1)针对众核体系结构的特点,提出了一个基于性能计数器的众核体系结构功耗解析模型。基于对Intel SCC众核平台功耗、性能的详细测试和分析,该模型综合考虑了芯片电压/频率和程序执行特征对功耗的影响,在一定程度上保证了模型估计的准确性。通过在Intel SCC众核平台上的实验分析,验证了该模型在DVFS下的功耗预测准确性,同时,实验结果表明,该模型的准确性优于其他众核功耗模型。(2)提出了一个可扩展众核系统能耗管理的解决方案,Powe Rock。针对并行应用程序的同步特点,提出了一个轻量的profiling方法;结合功耗、性能预测模型,Powe Rock能够快速获得应用程序的能耗控制profile,并根据管理优化目标,灵活控制程序部署后的最优功耗设置;针对众核体系结构中多电压/频率域的设计特点,设计了一个层次式的域感知DVFS控制机制,并实现了一个内核级的可扩展DVFS控制器。最后,本文在Barrelfish操作系统中实现了Powe Rock,并在Intel SCC平台中对其有效性、灵活性和可扩展性进行了验证。实验验证结果表明,相比静态功耗管理方法,动态能耗管理方法节约了高达65%的能耗或EDP(Energy Delay Product)。(3)研究了在具有多个电压/频率域的众核系统中的DVFS延迟特性,发现Intel SCC众核系统中不容忽视的DVFS延迟问题;基于上述研究和发现,提出了一种延迟感知的DVFS控制算法,用以避免过于频繁的功耗状态转换,提高DVFS的效率;本文在Barrelfish操作系统中实现了该DVFS控制算法,并使用Graph500等多个基准测试程序,在Intel SCC平台上完成了实验验证。实验结果表明,相比基准profile指导的能耗管理方法,延迟感知算法平均能够获得15.2%的执行性能提升,同时降低24.0%的能耗和31.3%的EDP。而且,本文的延迟感知算法性能优于现有基于电压调节间隔阈值的方法。