论文部分内容阅读
存储系统的性能是影响现代计算机系统性能的重要因素之一。近二十年来,芯片结构以及制造工艺的不断改进使得处理器和内存的工作效率都得到了相应的提高。但是,从现在的发展趋势来看,内存工作频率提高的速度远远低于处理器主频提高的速度,这使得处理器的访存性能越来越成为制约系统性能的瓶颈。 工业界和学术界一直致力于缩小处理器和存储器之间的差距,提高处理器的访存效率。最近5年来在硬件方面主要出现了下面三种相关技术,这些技术的出现为存储系统的优化带来了新的机会和问题。 ● DDRⅠ/Ⅱ等新型内存设备(DDRⅠ/Ⅱ SDRAM) ● 片内集成内存控制器(On-chip Memory Controller) ● 多核多线程架构(MultiCore and MultiThreading) 结合龙芯2号处理器的结构特点,本文系统的讨论了上述新的硬件技术对内存控制器设计的影响。本文的贡献主要分成评估和优化两个方面: ◆ 基于程序周期行为的性能评估方法 准确快速的性能评估环境和方法是进行各种性能优化的前提,考虑到硬件结构设计的特殊性,软件模拟器正逐渐成为性能评估的重要手段。本文用统计建立了一种基于程序周期行为的快速性能评估方法,在不损失精确度的前提下大大提高了软件模拟的速度。在详细的龙芯模拟器上,把SPEC 2000基准测试程序的模拟时间从10天缩短到40分钟内,IPC误差率控制在5%左右。 ◆ 片上内存控制器的访存调度 在处理器内部集成内存控制器以后,内存控制器可以直接访问处理器的访存队列,这为访存调度提供了很大的优化空间。本文比较了传统的地址映射机制和XOR机制在DDR SDRAM下对Page局部性的影响,讨论了单核处理器下和Page模式结合的访存调度策略以及多核处理器访存公平性的问题。实验数据表明,和Open Page模式相比,单核片上访存调度可以使龙芯2号处理器运行SPEC 2000测试程序的平均IPC提高8%左右,Stream测试程序的访存带宽提高23%。对于多核处理器运行SPEC程序的一部分组合,系统的整体性能可以提高7%。