片上互连网络容错关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:Depthcharge2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核技术的发展使得处理器向通信密集型转变,传统的总线设计不能满足相应的通信需求。片上互连网络具有高可扩展性和灵活性,已经成为解决多核处理器通信瓶颈的有效方式。但是,随着片上网络集成度不断增大,其可靠性问题也越来越严重。本文针对片上互连网络的永久链路错误和永久路由器组件错误的容错策略展开研究:第一,通过分析片上互连网络链路的永久性错误,提出了基于区域洪水路由的实时容错路由算法。为了实现实时的容错,我们首先提出了容错的MPI-like通信协议。在该协议中,如果发送请求消息的源结点一定时间内没有收到响应,就认为链路出错,并进入寻找无错路由的过程。我们提出的基于区域洪水的路由算法用于寻找无错路由。该算法在源结点和目的结点为顶点的矩形区域内广播寻找路由的报文,每一步搜寻都朝着目的结点的方向进行。这一算法相对于传统的洪水路由算法,减少了大量无用消息包,减少平均网络延迟,避免网络阻塞,同时却只带来了很小的容错能力损失。通过booksim模拟器比较平均包延迟,我们发现区域洪水路由相对于传统的洪水路由算法能够大幅地降低延迟。特别是在bit complement模式下,获得的延迟降低达25%。此外,我们还比较了区域洪水路由算法和传统洪水路由算法的容错能力。结果表明,在低错误(<4%)的网络中,我们的方法获得的容错能力比传统洪水路由只降低了2%。最后,我们使用RTL-Router以及DC(Design Compile)综合工具评估面积和功耗开销。相比于基本的路由器,我们的设计开销约为12%。第二,通过分析片上互连网络路由器组件的永久性错误,提出了高可靠性、高性能和低开销的容错路由器设计。在两阶段标准路由器基础上,我们使用双路由策略容忍路由计算单元出错,使用默认胜利者策略容忍虚拟通道分配单元出错,使用实时仲裁器选择策略容忍交叉开关分配单元出错以及使用双旁路总线机制容忍交叉开关单出错。和之前的容错路由器设计不同,我们首次利用流水段优化和路由算法的特点,在容错设计中考虑了网络性能,并解决了错误容忍所带来的性能下降问题。我们的设计在高负载网络下仍然可以维持性能。我们在文中与现有的容错路由器设计进行了比较,结果表明我们的设计可以获得更好的性能,尤其是在网络负载较高时。同时,我们评估了设计的面积开销,并利用硅保护因子(SPF)评价路由器的可靠性。结果表明,在硬件开销降低16%的基础上,SPF提高了44.7%。因此,我们的路由器设计具有更好的性能,更低的开销以及更高的可靠性。综上,本文围绕片上网络的容错问题展开研究。首先,针对片上网络的永久性链路错误,提出了基于区域洪水的实时容错路由算法。该算法通过容错能力的稍微降低换取网络性能的大幅提升。其次,本文针对片上网络路由器组件错误,提出了基于两阶段标准路由器的容错路由器设计。该路由器设计可以容忍多个流水单元出错,并同时实现了高可靠性,高性能和低开销。本文的工作具有一定的理论和应用价值。
其他文献
随着激光技术的发展,对光学元件的各项指标要求也逐步提高,其抗激光损伤能力是非常重要的一项。长脉冲激光因其单脉冲能量大、损坏能力强等特点,相比短脉冲激光而言,可以对靶
光速,是一个非常重要的物理量,光学和电磁学中的诸多定理定律都与之息息相关。对光速的测量,不但推动了物理学的发展,还促进了测量技术的革新。光纤作为一种光波导介质,具有
回旋行波管作为电真空器件家族中重要一员,具有高功率宽频带的特点,在毫米波雷达、毫米波通讯、电子战等方面具有广泛的应用前景。然而回旋行波管工作在W或更高频段时,若工作
激光支持爆轰波是激光与物质相互作用的现象之一,可应用于硅基微结构加工,航天紧固件固化,在航天推进,激光微加工等领域均具有广泛的应用前景。所以对激光支持爆轰波相关研究
本文分析了校企合作人才培养的必要性和可行性,并结合校企合作人才培养的具体实施,对校企合作的不同模式进行探讨,认为企业和学校双主体运行模式是当前应用型人才培养的最佳
为了解决射频(RF)技术的发展带来的安全隐患,在现有有关射频电路的寿命预测相关研究相对缺乏的情况下,本文总结了国内外有关科研成果,以射频晶体振荡器为对象展开了寿命预测
随着技术的进步,人们对处理器的运算能力的要求不断提高,人们对其要求也不断随之提高,异构多核片上系统(Multi-Processors System on Chip, MPSoC)应运而生。异构多核片上系
<正>卫视竞争演化至今,竞争焦点已非单纯的电视创制实务,而要回答一个更为宏大的命题:如何走系统协调的可持续发展之路以回应中国社会的政治、经济、文化诉求。"十二五"规划
在纳米工艺水平下,负偏置温度不稳定性(Negative Bias Temperature Instability,NBTI)效应引起的电路老化成为威胁数字集成电路可靠性的一个重要因素。IVC抗老化方法是在集成
时域不连续伽略金方法是近年来数值技术领域研究火热的一种时域算法。这种算法并不是一种无中生有的新算法而是吸收多种时域算法的优点逐步发展形成的。在空间离散上借鉴了有