面向性能优化的压缩cache技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：roger_wen

【摘要】

：

随着半导体工艺技术的不断发展,微处理器与主存速度差距的日益扩大,现代处理器都需要在片内设置一级或多级cache来缓解越来越严重的访存压力。此外,随着芯片容量的不断扩大,

【作者】

：

田新华

【出处】

：

国防科学技术大学

【发表日期】

：

2007年期

【关键词】

：

S-FPC压缩算法压缩Cache 部分Cache行预取压缩cache替换策略 SMT MLRU-C替换策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着半导体工艺技术的不断发展,微处理器与主存速度差距的日益扩大,现代处理器都需要在片内设置一级或多级cache来缓解越来越严重的访存压力。此外,随着芯片容量的不断扩大,多核与多线程结构正成为当代处理器设计的主流。这些结构通过开发线程级并行性,极大地提高了处理器的计算吞吐率,但同时也对处理器存储子系统的访存吞吐能力提出了严重的挑战。处理器设计者需要在固定的芯片面积内权衡和折衷,或者增加内核数量或线程数量以获得更高的计算能力,或者增加片内Cache容量来提高处理器的访存能力,从而使这两种能力达到相互平衡,避免任何一种能力成为性能瓶颈。将压缩技术应用于片内cache数据的保存,能显著增加cache的有效容量,减少cache失效,缓解处理器计算能力与其访存压力之间的矛盾,使上述权衡向计算能力倾斜。但是,压缩cache技术也会给处理器的性能带来负面影响,因为,它在处理器的访存延迟中加入了数据解压缩的延迟开销,使cache的命中延迟增加。为此,本文以提升系统性能为目标,从简化压缩编码算法降低解压缩延迟,优化压缩cache层次结构,改善压缩cache替换策略等几个方面着手,对压缩cache的性能优化技术进行了深入研究,主要取得了以下一些研究成果:1.对原本应用于L2 cache压缩的常见模式压缩(Frequent Pattern Compression,FPC)算法进行了简化,并分解了该算法的解压缩流程,提出并设计了一种基于简单常见模式压缩(Simple Frequent Pattern Compression,S-FPC)编码算法的解压缩流程,减少L2压缩cache行的解压缩延迟开销1个处理器周期,并且使该算法能被应用于L1数据cache的压缩。对简化后的压缩编码算法的压缩效果进行了模拟试验和评估,并详细描述了S-FPC压缩编码算法的硬件实现。2.提出并设计了一种基于统一的简单常见模式压缩(S-FPC)编码的压缩cache层次结构UCCH(Unified Compressed Cache Hierarchy)。UCCH结构在L1数据cache和L2 cache以统一的压缩编码保存数据,能显著提高片内L1数据cache和L2 cache的有效容量。另外,在UCCH结构中,L1数据cache的压缩结合了部分cache行预取功能,可充分发挥预取技术显著降低cache失效率的优点,却不会招致通常的预取技术可能产生的cache污染与访存带宽需求增加的缺点,也不需要额外添加预取缓冲。UCCH结构的设计显著改善了压缩cache的性能。3.提出了一种新颖的基于LRU修正的压缩cache替换策略MLRU-C(ModifiedLRU Replacement Policy for Compressed Cache),用于改善L2压缩cache的替换行为。MLRU-C替换策略利用压缩cache中额外的tag资源,构造了一种影子tag机制,该机制能对传统LRU替换策略经常出现的几种错误的cache替换行为进行鉴别,并将其记录到一个错误记录表MRT(Mistake Record Table)中,然后根据此记录表对LRU替换错误进行及时纠正。模拟实验表明,MLRU-C能有效地改善L2压缩cache的替换行为,减少L2压缩cache的失效率。4.研究了压缩cache技术对多线程处理器性能的影响,并通过模拟实验验证了UCCH结构能够改善多线程处理器的性能。由于多线程处理器中有多个同时运行的线程共享整个片内cache层次结构,破坏了从L1数据cache到L2 cache的数据局部性,增大了cache失效率,并使L1-L2-主存之间的总线传输带宽压力显著增长,因此,虽然多线程处理器降低了对访存延迟的敏感性,但却显著增加了对cache层次结构的容量以及访问带宽的敏感性。由于UCCH结构能够显著增加L1数据cache和L2 cache的有效容量,同时由于在L1-L2-主存之间直接以压缩格式传输数据,能显著降低L1-L2-主存之间的总线传输带宽需求,因此UCCH结构能够改善SMT处理器的访存性能。

其他文献

胃安颗粒治疗小儿肠系膜淋巴结炎临床疗效观察

目的：胃安颗粒治疗小儿肠系膜淋巴结炎临床疗效观察方法：将80例经彩色多普勒确诊为肠系膜淋巴结炎的患儿随机分为治疗组和对照组各40例。对照组给予阿奇霉素口服，治疗组在对照组

学位

胃安颗粒小儿肠系膜淋巴结炎

自律计算系统的自律可信性评估研究

随着计算机技术的快速发展和广泛应用,计算机软件和硬件设备高度集成,传统技术无法满足人们对系统可靠性、安全性等需求,迫切需要新的理论和方法去解决软件管理和安全危机,因

学位

自律计算自律评估自律可信性量化分析支持向量机

企业固定资产管理存在问题及治理对策

固定资产管理是指对企业内部使用时间达到一定期限的非货币性质资产进行科学管理,提高资产利用效率,对企业在新时期的发展有重要影响。但是,许多企业没有正确认识固定资产管

期刊

企业固定资产管理问题对策

中央财政支持地方高校发展专项资金及配套资金的管理与使用

中央财政支持地方高校发展专项资金对提高地方高等教育质量、支持地方高校的重点发展和特色办学起到了积极作用,有力推动了地方高校整体水平。近年来,专项资金投入呈逐年上升

期刊

中央财政地方高校专项基金管理使用

银翘散在重症肺炎治疗中的临床应用

目的：探讨银翘散在重症肺炎治疗中的临床疗效。方法：收集我院重症肺炎80例作为研究对象,分为观察组和对照组,对照组给予常规综合治疗,观察组在对照组基础上加用银翘散,评估两组

期刊

重症肺炎银翘散临床应用

浅议财务报表分析的局限性及对策

随着企业规模的不断扩大,财务报表分析对企业的生存与发展都起着至关重要的作用,但因为财务报表分析受到财务报表数据自身形成的原因、财务报表的分析方法、报表分析人员自身

期刊

财务报表分析局限性应对策略

电商金融的运作模式与商业银行的应对策略

引言:如今,金融服务方式互联网化是学术界研究的热点,而此类研讨大多将金融企业的互联网业务和互联网企业的金融业务混在一起,其理论结果有诸多不足.电商金融与互联网企业的

期刊

信息环境下会计审计诚信问题探讨

随着公司数量及模式的不断增加,提高企业管理和运营水平成为提升企业竞争力的必经之路.其中,会计审计工作作为其中的重要组成部分,存在着会计审计诚信问题,阻碍了企业的长期

期刊

星载固态存储管理技术的应用研究

从近地卫星到深空探测,从载人航天到全球定位系统,从着陆巡视器到空间站,我国航天任务的数量不断增多、探索范围越来越广、任务形式和研究内容日益丰富,通过航天器平台获取了

学位

星载大容量存储器固态存储器动态管理容错机制

水环境中磺胺类抗生素的污染现状与处理技术研究进展

磺胺类抗生素在医药和养殖业中广泛使用，由于难以在环境中降解，其引起的污染问题得到了广泛关注。为了解磺胺类抗生素污染及处理技术，对其使用现状、危害及其在水环境中的迁移状

期刊

磺胺类抗生素污染处理技术sulfonamides pollution treatment technologies

面向性能优化的压缩cache技术研究

其他学术论文