论文部分内容阅读
随着半导体工艺技术的不断发展,微处理器已经从单核发展到多核乃至众核。芯片上集成的计算资源也越来越多。GPGPU是一种典型的多核流处理器,具有出色的计算性能潜力,被广泛的应用于生命科学、图形视觉和信号处理等高性能计算和科学计算领域中。GPGPU的片上网络直接决定了芯片性能,是GPGPU芯片的关键部件。与通用CPU通信方式不同,GPGPU的数据传输只存在于计算节点与存控节点之间。因此GPGPU的片上网络会不同于多核CPU。本论文对面向GPGPU的高效片上网络关键技术进行了研究,并在GPGPU-Sim模拟器上进行了相关实现和性能测试。论文的主要工作内容以及研究成果包括以下几个方面:(1)提出了GPGPU片上网络中路由器的动态虚通道划分机制GPGPU片上网络资源的分配存在不均衡问题,本文针对此问题提出了动态虚通道划分机制。该机制设计了:初始状态、采样状态和主运行状态。中央决策模块负责对片上网络报文种类比例的进行动态采集,比较不同虚通道配置下的采样结果,然后确定主运行状态下片上网络中虚通道的最佳配置。该机制提高了网络资源的利用率,促使GPGPU获得了更高的系统性能。(2)设计实现了GPGPU低开销无冲突的回复网络针对GPGPU中回复网络的通信特点,本论文提出了低开销无冲突回复网络思想。在设计实现中计算节点与存控节点被分成若干个小组,然后通过分析存控节点向不同计算节点组传输回复报文的冲突产生现象,设计了授权判别模块。该模块对每个存控节点的发包进行授权控制,这样可以避免了同组之间可能存在的报文冲突。采用优化后的路由器使其降低片上网络的面积和功耗开销,并实现报文在相邻路由器之间的单拍传输延迟。本文在GPGPU-Sim模拟器上对上述设计方案进行了实现,并针对ISPASS[38]和Rodinia[42]测试集中的多个测试程序进行系统性能的测试和分析。实验结果表明:(1)动态虚通道划分机制在增加额外少数硬件开销的情况下能够较高的提升系统性能。(2)低开销无冲突回复网络设计则牺牲了少部分系统性能换取片上网络面积和功耗开销的大幅度降低。