面向GPGPU的高效片上网络关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:chichuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体工艺技术的不断发展,微处理器已经从单核发展到多核乃至众核。芯片上集成的计算资源也越来越多。GPGPU是一种典型的多核流处理器,具有出色的计算性能潜力,被广泛的应用于生命科学、图形视觉和信号处理等高性能计算和科学计算领域中。GPGPU的片上网络直接决定了芯片性能,是GPGPU芯片的关键部件。与通用CPU通信方式不同,GPGPU的数据传输只存在于计算节点与存控节点之间。因此GPGPU的片上网络会不同于多核CPU。本论文对面向GPGPU的高效片上网络关键技术进行了研究,并在GPGPU-Sim模拟器上进行了相关实现和性能测试。论文的主要工作内容以及研究成果包括以下几个方面:(1)提出了GPGPU片上网络中路由器的动态虚通道划分机制GPGPU片上网络资源的分配存在不均衡问题,本文针对此问题提出了动态虚通道划分机制。该机制设计了:初始状态、采样状态和主运行状态。中央决策模块负责对片上网络报文种类比例的进行动态采集,比较不同虚通道配置下的采样结果,然后确定主运行状态下片上网络中虚通道的最佳配置。该机制提高了网络资源的利用率,促使GPGPU获得了更高的系统性能。(2)设计实现了GPGPU低开销无冲突的回复网络针对GPGPU中回复网络的通信特点,本论文提出了低开销无冲突回复网络思想。在设计实现中计算节点与存控节点被分成若干个小组,然后通过分析存控节点向不同计算节点组传输回复报文的冲突产生现象,设计了授权判别模块。该模块对每个存控节点的发包进行授权控制,这样可以避免了同组之间可能存在的报文冲突。采用优化后的路由器使其降低片上网络的面积和功耗开销,并实现报文在相邻路由器之间的单拍传输延迟。本文在GPGPU-Sim模拟器上对上述设计方案进行了实现,并针对ISPASS[38]和Rodinia[42]测试集中的多个测试程序进行系统性能的测试和分析。实验结果表明:(1)动态虚通道划分机制在增加额外少数硬件开销的情况下能够较高的提升系统性能。(2)低开销无冲突回复网络设计则牺牲了少部分系统性能换取片上网络面积和功耗开销的大幅度降低。
其他文献
非合作发射源的无源定位在军用和民用中都有较强的需求。本文提出一种基于压缩感知(CS)理论和分布式接收的非合作发射源定位方法。该方法适用于复杂的散射环境,如多径散射较
近期,全国屡屡发生个人极端暴力事件,行为人手段残忍、不计后果,造成了重大人员和财产伤亡,造成恶劣的社会影响,也引起了社会广泛关注和思考。如何完善矛盾隐患化解、加强社
目的本研究通过检测SAA、CRP与CEA三种标志物在结肠癌患者血清中的表达以及分析SAA、CRP与CEA联合检测的相关性,以期揭示血清中炎性介质SAA和CRP的含量对术前评估结肠癌的临
为了揭示层序地层格架下及古地理环境控制下的聚煤特征,以三江盆地早白垩世含煤岩系为例进行了层序古地理和聚煤作用研究.识别出冲积扇、辫状河、曲流河、三角洲、湖泊等5种
黄氏[1]倡“治血先治风,风行血自通”,诚要言不烦,足为治血瘀之炯鉴。现就本课题的最近理论研究成果,风药补血、活血、止血及相关问题探讨如次。1风药的含义及特点风药是指在传统中医
研究了氟草烟的重要中间体4-氨基-3,5-二氯-2,6-二氟吡啶的合成新方法。以五氯吡啶为原料,采用分子筛控制水分,经氟化、氨基化一锅法合成4-氨基-3,5-二氯-2,6-二氟吡啶。最佳
自中日建交以来,双边经贸发展势头良好,虽然也存在摩擦,但总体上中日经贸摩擦远不如中美贸易和美日贸易摩擦那么激烈和频繁。进入21世纪以来,中日之间在经济和贸易领域的摩擦
1940年以来,各个国家开始提高对政府资金的关注,民主意识开始增强,政府审计的范围开始逐渐变为以绩效审计为主,财务审计和绩效审计的共存审计形式。近三十年,在我国政府绩效
高等职业教育在我国是一种新的教育模式,近年来教育工作者做了大量的探索工作,取得了很大成绩,但依然存在不少问题,如法制建设滞后,走教育社会化不够,教育内容、手段有待进一