分布式动态可重构多核处理器上的取指停顿容忍技术

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tempman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着片上多处理器(CMP)成为各种芯片设计的主流结构,如何提高串行程序的性能已成为迫待解决的问题。一些研究者提出了采用分布式动态可重构多核处理器(Distributed Dynamic Reconfigurable Chip Multiprocessor,DDRCMP)结构,能够在灵活支持多线程程序运行的同时,通过动态地将片上的物理核组合成性能更为强大的逻辑处理器,来满足加速单个线程或串行任务的需求。但是,这种结构目前存在的一个主要的性能瓶颈是取指停顿。取指停顿主要是由各种误预测事件引起的流水线刷新造成的。本文主要针对两种常见的误预测事件——访存违例和分支误预测,提出了一种分布式回放协议和一种分布式控制无关技术,用来减少误预测事件对分布动态可重构多核结构造成的性能损失。   本文的主要研究工作和成果包括:   (1)研究了DDRCMP上的数据推测恢复机制,提出了一种分布式回放协议,该协议提供了一种轻量级的指令回放机制使得处理器不需要冲刷流水线就能够从数据误预测中恢复。本文将分布式回放协议应用到分布式动态可重构多核处理器TFlex的访存违例恢复当中,加入了回放协议的TFlex从访存推测中解放出来,所有内存读指令可以激进地发射而不必担心访存违例会造成性能下降,从而极大地发掘了串行任务的性能极限,并且提高了TFlex的性能可扩展性。实验结果表明,加入了分布式回放协议后,由16个物理核组成的TFlex逻辑处理器性能达到了完美性能的99%。   (2)研究了DDRCMP上的分支预测恢复机制,提出了一种分布式控制无关技术,用于减少分支误预测引起的性能损失。本文将分布式控制无关应用到TFlex的分支误预测恢复当中。分布式控制无关技术通过保存误预测分支指令后面的有用指令和计算结果,进一步减少流水线冲刷广度和次数;结合分布式回放协议,TFlex能够快速识别和重新执行被保留的数据依赖被更新的指令,从而保证了程序的正确性。分布式控制无关技术明显地提高了串行程序在TFlex上运行的性能,实验结果表明,加入分布式控制无关后,运行在16核TFlex上的数十个应用程序获得了35%的几何平均加速。
其他文献
文章主要针对山西地区现存的古代壁画,分析古代壁画所具有的艺术性,了解其中蕴含的历史价值与美术价值,并对保护、修复工作展开探讨,分析壁画保护的一系列流程,提出了原地保
近年来,生物特征识别技术受到了人们的普遍关注。与传统的基于物品的(例如身份证)或基于记忆的(例如密码)身份验证方式不同,生物特征是随身携带、不会丢失、不会被遗忘、不容
现今视频监控系统实时监控被监视对象的行为,在管理和监测城市的任务上具有越来越重要的地位,可以说是无处不在。而视频监控系统需要朝着智能化的方向前进,要尽可能地减少人工干预或完全自动化地完成所需的任务。智能视频监控技术主要是用计算机视觉的方法实现所需完成的视觉任务,例如场景中的目标定位、目标识别、目标跟踪等视觉任务,智能监控的过程不需要人为进行干预。智能视频监控技术在摄像机拍录的视频图像序列上进行自动
目前,中文信息处理的最大难题是如何实现汉语句子的自动标识。“句处理”主要分为单句处理和复句的处理,现在研究较多的是单句的处理。而复句是连接单句与篇章的桥梁,因而复
随着IT行业的发展,软件版权保护问题日益突出,由此需求而发展起来的软件版权保护技术也越来越受到人们的关注。其中的一款保护手段是基于软件水印的。软件水印技术是将拥有者的