片上内存控制器性能评估和优化

来源 :中国科学院计算技术研究所 | 被引量 : 9次 | 上传用户:vertra
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
存储系统的性能是影响现代计算机系统性能的重要因素之一。近二十年来,芯片结构以及制造工艺的不断改进使得处理器和内存的工作效率都得到了相应的提高。但是,从现在的发展趋势来看,内存工作频率提高的速度远远低于处理器主频提高的速度,这使得处理器的访存性能越来越成为制约系统性能的瓶颈。 工业界和学术界一直致力于缩小处理器和存储器之间的差距,提高处理器的访存效率。最近5年来在硬件方面主要出现了下面三种相关技术,这些技术的出现为存储系统的优化带来了新的机会和问题。 ● DDRⅠ/Ⅱ等新型内存设备(DDRⅠ/Ⅱ SDRAM) ● 片内集成内存控制器(On-chip Memory Controller) ● 多核多线程架构(MultiCore and MultiThreading) 结合龙芯2号处理器的结构特点,本文系统的讨论了上述新的硬件技术对内存控制器设计的影响。本文的贡献主要分成评估和优化两个方面: ◆ 基于程序周期行为的性能评估方法 准确快速的性能评估环境和方法是进行各种性能优化的前提,考虑到硬件结构设计的特殊性,软件模拟器正逐渐成为性能评估的重要手段。本文用统计建立了一种基于程序周期行为的快速性能评估方法,在不损失精确度的前提下大大提高了软件模拟的速度。在详细的龙芯模拟器上,把SPEC 2000基准测试程序的模拟时间从10天缩短到40分钟内,IPC误差率控制在5%左右。 ◆ 片上内存控制器的访存调度 在处理器内部集成内存控制器以后,内存控制器可以直接访问处理器的访存队列,这为访存调度提供了很大的优化空间。本文比较了传统的地址映射机制和XOR机制在DDR SDRAM下对Page局部性的影响,讨论了单核处理器下和Page模式结合的访存调度策略以及多核处理器访存公平性的问题。实验数据表明,和Open Page模式相比,单核片上访存调度可以使龙芯2号处理器运行SPEC 2000测试程序的平均IPC提高8%左右,Stream测试程序的访存带宽提高23%。对于多核处理器运行SPEC程序的一部分组合,系统的整体性能可以提高7%。
其他文献
随着IP技术的发展,基于IP技术的各种应用变得越来越广泛。不但在计算机界,而且在通信界也越来越重视对IP技术的研究。为了满足人们日益增长的对通信网络的需求,经过多年的努力,产
随着Internet的迅猛发展,信息逐步数字化、网络化、全球化。如何高效、准确地利用互联网上的有用信息已成为人们关心的课题。对于生物信息学研究者来说,能否充分利用国际国内
电子商务系统是利用现代网络技术来实现商品销售和管理的智能系统,它由销售交易中心和若干销售终端组成,终端通过CDMA网络接入。 论文总结了笔者参与电子商务系统数据库设计
PDSN是分组数据服务节点的缩写。PDSN模拟器是我们与北京首信股份有限公司合作开发的一个无线接入网(RAN)和分组交换公共数据网(PSPDN)之间的网关。其主要的功能是为终端用户
本文通过对网格资源管理中网格资源描述、发现、调度以及QOS保证等关键技术的研究,在网格市场经济资源管理模型的基础上,设计了一种基于计算期望的网格资源管理模型。具体研究
形式概念分析是德国学者Wille于1982年作为一种数学理论首先提出的,概念格结构模型是它的核心数据结构。概念格本质上描述了对象和属性之间的联系,表明了概念之间的泛化和例
工作流技术是一种正在迅速发展的软件技术,它在不同的行业已经得到了广泛应用。工作流技术得到重视的一个重要原因是它实现了信息系统的应用逻辑与过程逻辑的分离,是实现业务流
IP协议将成为下一代无线通信网络的核心协议之一,但是,对无线网络来说,IP分组信头过大,严重地浪费了宝贵的无线带宽,因此,必须对IP分组信头进行压缩,提高无线带宽利用率。 本论文
随着国内电信市场竞争的同趋激烈,电信运营商的经营模式逐渐从“业务驱动”向“客户驱动”转化、从“粗放式经营”向“精确化管理”转变。为了更好地做到对企业的决策支持,经营
基于主机的入侵检测系统(HIDS)因其数据源来自于操作系统的反馈,因而具备良好的检测效率和数据源的可信度。但是在以往的HIDS设计中,比较偏重于“事前”防御(入侵者正在尝试