分片式处理器上指令调度器的设计及优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:dangerwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体技术和计算机体系结构技术的发展,分片式处理器逐渐成为多核领域的一个发展方向。分片式处理器有效解决和缓解了线延迟、功耗、可扩展性等现代处理器面临的主要问题。分片式处理器采用全局控制流和局部数据流相结合的执行模型,将程序划分成单入口、多出口的超块结构,超块之间维护控制依赖关系,超块内部采用数据流驱动的方式执行以开发指令级并行性。分片式处理器结构的类数据流执行模型对编译器提出了更多的要求,指令调度器作为分片式处理器编译系统的重要组成部分,是完成软硬件协同设计提高程序性能的关键。本文围绕分片式处理器TPA-PI,分析研究影响指令调度的各种因素,设计并实现适用于TPA-PI结构的指令调度器。论文的主要研究内容和成果包括以下几个方面:(1)设计并实现了TPA-PI处理器的指令调度器。TPA-PI指令调度器将程序以超块为单位映射到TPA-PI处理器执行单元阵列上。它以TPA-C程序作为输入,生成TPA-S格式的汇编代码程序。指令调度器在将TPA-C指令格式转化为TPA-S指令格式时插入软件扇出树。指令调度器采用启发式的方法将程序以超块为单位映射到处理器单元阵列上,在映射时要综合考虑超块内指令级并行性和硬件资源的利用率之间的关系。最后指令调度器生成TPA-S格式的汇编代码程序。(2)对影响程序执行性能的因素进行量化分析,改进指令调度的启发式函数。首先使用TPA-PI的编译器和软件模拟器为指令调度器搭建实验平台,在这个实验平台上实现一个基于贪心的启发式指令调度算法。然后以这个调度实现为基础,分别将关键路径、负载平衡、数据局部性、寄存器指令、锚点指令、加权路径和平均路径、片上网络等参数加入到启发式函数中,衡量这些参数对程序执行性能的影响。并根据实验数据结果对启发式函数进行修改。(3)提出基于AVBLON和ARBLON启发式函数的指令调度算法。将锚点指令(A)、加权路径信息(V)、负载平衡(B)、数据局部性(L)、寄存器依赖(O)、片上网络(N)等参数加入到启发式函数中,形成最后的AVBLON指令调度算法。实验表明,基于AVBLON启发式指令调度器比基于贪心算法的调度器的程序性能提高了28%。为了弥补加权路径参数必须得到程序剖析信息的缺陷提出使用平均路径参数代替加权路径参数。本论文的研究工作为TPA-PI提供了可用的指令调度器,为处理器开发更多的指令级并行性提供帮助。实验得到的结果也可以指导编译系统设计者和处理器结构设计者对编译系统和处理器结构进行进一步优化。
其他文献
对于领域性的信息检索系统来说,准确率的要求往往是其最为关心的,因为目前通用的信息检索系统对于具有高度领域性的信息来说并不能展现出良好的效果,甚至远远达不到可用的程
随着因特网的发展,网络信息量正突飞猛进地增长,人们越来越依赖搜索引擎来准确地获取所需的信息。搜索引擎在为网民提供便捷的搜索服务的同时,也影响着网站的发展前景,所以搜
生物医学文本挖掘的目的是借助文本挖掘技术帮助生物医学研究者从海量文献中更有效地找到所需信息、发现隐藏的生物医学知识。通过对孟德尔人类遗传在线(Online Mendelian In
近年来,随着手机用户的不断增长,短信已经在人们的日常生活中发展成为一种非常重要的交流方式,同时,由于短信的高效,低成本和无时空限制等优势受到了越来越多企业的重视。然而,目前
目前,随着网络技术的发展和各种网络应用的普及,与传统的静态HTML页面相比,蕴含数据更加丰富,质量更高的网络数据库正引起研究人员的广泛关注。然而,在特定的应用领域,由于不
在企业管理软件中,业务构件可以通过参数化和配置技术被复用以适应业务需求的变化,这种构件粒度大、可变参数多、结构复杂,难以开发。业务构件是所要处理的业务对象(如业务单
现阶段搭载多核处理器的网络服务器平台越来越普及。而操作系统是在单核处理器时代开发,无法充分发挥多核处理器的强大处理能力,所以对串行协议栈进行并行优化具有重要意义。
基于视频信息的说话者检测,就是不借助音频信息,单从说话者的嘴唇动作来判定谁在说话的检测方法。涉及到的相关技术有视频镜头分割、人脸检测与跟踪、嘴唇区域定位以及唇动判
关键短语抽取是文本信息处理的重要技术。随着网络时代的到来,在线文档呈现出几何级数的增长,“信息爆炸”成为这个时代的主要特征。检索和利用网络信息变得越来越困难,关键
随着Internet呈爆炸式的增长,人们经常会遇到网络拥塞和服务质量低等一系列问题。因此,对大规模网络行为研究已是当务之急。网络模拟作为计算机网络研究的主要手段,以周期小