面向高密度计算的多核处理器结构研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zm_627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类对计算能力的需求不但推动着高性能计算技术的不断发展,还推动着微处理器技术的发展。当前的超级计算机中普遍使用了高性能的微处理器,因此微处理器的性能对超级计算机和高性能计算有着至关重要的作用。在高性能计算中有一大类应用是计算和访存密集型的应用,如科学和工程计算,数值模拟和信号处理等。如何对多核处理器上此类应用程序进行性能分析和结构优化,一直是众多科研工作者的研究重点。依托国产高性能多核通用处理器研制项目,本文面向高密度计算类应用,对通用处理器性能分析方法、结构优化以及高密度计算性能优化等问题进行了深入的探讨和研究。本文的主要工作和创新如下:1.一种用于指导处理器结构优化的性能建模及分析方法现有的性能分析通常基于仿真拟合或宏观建模的方法,难以具体地刻画结构参数对性能的影响,对处理器结构优化的指导作用有限。为了深刻地揭示处理器结构参数与矩阵乘法性能的关系,本文通过分析矩阵乘法计算/访存行为,结合处理器结构特点,建立了单核和多核通用处理器上的矩阵乘法性能模型。在此基础上,给出了矩阵乘法最优性能下处理器结构参数应满足的必要条件,包括寄存器个数和访存带宽的理论下界。以Intel Core i7和Godson-3A两种典型的通用处理器为验证平台对性能模型进行了验证,实验结果表明,在四核矩阵乘法中,该模型的准确度分别达到90%和86%以上。本文提出的性能模型,可用于分析处理器在计算和访存中的瓶颈,并可用于指导处理器的优化设计。2.一种乘加shuffle融合的浮点向量指令根据本文提出的性能模型,对基于向量扩展处理器的应用程序进行了性能分析。分析表明,在设计基于向量扩展处理器的应用程序时,需要大量的数据shuffle指令来配合向量运算指令,严重地影响了程序性能。为此,本文提出一种新的向量指令,具有向量乘加指令和shuffle指令的功能,使用该指令可以完全消除shuffle指令,减少33%以上的程序长度,与使用shuffle指令的普通向量扩展处理器相比,核心程序性能提高33%以上,并且降低了功耗开销。3.一种新的计算/访存分离的处理器结构为了满足高密度计算应用的要求,本文基于性能模型,针对访存瓶颈提出了一种新的计算/访存分离的处理器结构。本文借鉴了传统计算/访存分离结构的思想,在多核通用处理器存储结构的基础上,增加了一个访存协处理器。当进行高密度计算时,由访存协处理器负责在寄存器和L2 cache/内存之间、L2 cache和内存之间传输数据,或对数据进行预取。访存协处理器的使用能够有效隐藏访存延迟,提高访存带宽,与Godson-3A相比,访存带宽提高了一倍。4.基于Godson-3B处理器结构实现了高效的矩阵乘法在优化的龙芯处理器结构上,为了获得高效的矩阵乘法,本文针对矩阵乘法中A、B和C三个矩阵各自的访存特点,采用不同的方法对其访存行为进行优化,并使用访存协处理器对数据进行预取,隐藏访存时间。优化后的矩阵乘法性能比Godson-3A提高了10倍以上,达到119.0Gflops,效率为93.0%;性能/功耗比为2.98Gflops/W,优于当前主流处理器。
其他文献
利用网络分布式存储系统存储大数据已成为数据存储技术的发展趋势。网络分布式存储系统通常由数量众多的存储节点构成,由于人为或自然灾难的不可避免性,或是存储节点本身的低可
以“现代集约持续农业”为指导思想,以保土、保肥为关键,开发与保护并重,在云南热区山地建立经济林或混农林业为主体的山地型农业生产体系。为实现定目标,必须加强领导,深入调查资
目的建立顶空气相色谱-质谱检测食品包装材料中10种残留有机溶剂的分析方法。方法采用GC-MS选择离子监测(SIM)模式进行定量分析。结果 10种溶剂在0.001~0.1 mg/m2浓度范围线
文章主要运用文献资料法、问卷调查法与数理统计法,以"绳梯"训练对初中生耐力素质的影响为研究对象,通过实验前后数据的对比与分析。相比较之下,利用软梯训练初中一年级学生
闪存是20世纪80年代由因特尔公司和东芝公司发明的一种新型存储介质,相比传统的磁盘,它在I/O性能,抗震性,功耗,体积等诸多方面都具有明显的优势。所以近年来,闪存有逐渐替代
会计信息是企业记录会计核算过程、呈现会计核算结果的重要载体,是对企业财务状况、经营成果和资金变动情况等的信息反映,企业依据会计信息核算结果可以对其经营业绩做出客观的评价和对下一步的经营决策做出科学的估判。由于受到市场环境不确定性和市场竞争复杂性的影响,企业生产经营模式也必然处于一种动态的完善和调整之中,因而这也对企业会计信息质量提出了非常高的要求。高质量的会计信息可以及时、真实的反映出企业的财务状
企业公民是企业与社会和政府的一种新型契约.本文在澄清了企业社会责任和企业公民的含义及其内在联系的基础上,利用利益相关者理论,指出作为企业公民自觉承担社会责任将获得
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文对SHIBOR进行类模型建模,得到SHIBOR对数收益率序列在不考虑非对称性时拟合最好的模型为,而考虑菲对称性时最好的模型为。得到模型后计算值,从而了解SHIBOR的利率风险特点,并帮助商业银行更有效的应对利率风险。  SHIBOR 模型 模型  引言  SHIBOR对外发布时问在2007年。SHIBOR由央行挑选的交易频繁且规模大的商业银行共同定价,因此能代表中国同业拆借利率的平均水平。在利
期刊