指令调度相关论文
针对综采自动化跟机工艺设计和参数调试成本高、周期长、过程繁琐的问题,提出了综采跟机工艺数字孪生系统架构,从物理设备、虚实交互......
处理器系统是由硬件设备,操作系统和编译器三方面紧密耦合而成的。编译器的性能好坏直接影响系统的整体性能。龙芯2号是我国自主研......
在嵌入式系统中,常常需要开发一些复杂的应用,同时还要满足性能和功耗的要求。为了达到这些要求,可能需要使用可定制的处理器结构......
本课题的研究方向是基于现代编译结构及编译技术的角度,而进行的嵌入式系统结构的设计优化。本课题的目的是要从现代编译结构特征及......
数字信号处理(Digital Signal Processing,DSP)普遍采取静态指令调度技术的VLIW(Very Long Instruction Word)体系结构,在很大程度上......
随着半导体技术和计算机体系结构技术的发展,分片式处理器逐渐成为多核领域的一个发展方向。分片式处理器有效解决和缓解了线延迟、......
随着大规模集成电路设计技术的发展和计算机体系结构的创新,处理器的性能提升迅速。在计算机体系结构的创新中,指令级并行对处理器......
智能电子锁是智慧家庭乃至智慧城市建设的典型代表,利用足够安全和便捷的智能电子锁对民宿、公寓进行智能化管理,构建共享公寓系统......
现代高性能数字信号处理器(Digital Signal Processor,DSP)许多都是超长指令字(Very Long Instruction Word,VLIW)体系结构,拥有丰......
现代超标量处理器普遍采用激进的乱序执行技术,多条指令在处理器中同时乱序执行,使得只有部分指令处于关键路径上,对这部分指令鉴......
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性......
指令调度对于充分发挥现代高性能RISC(reducedinstructionsetcomputer)处理器的指令级并行处理能力至关重要。基于扩展的装入延时......
GCC编译器可通过DUMP算法记录指令调度过程并输出,但是,只针对使用O0以上的编译优化的前提下,指令调度DUMP算法使编译器在使用O0编......
提出了很多结合技术使得指令调度与寄存器分配之间进行一些信息交互,在没有引入过多溢出代码的情况下提高了指令级并行度,从而提高......
为了改善寄存器压力问题,提出一种寄存器压力敏感的指令调度算法。该算法在传统表调度算法的基础上采用关键路径为优先级函数,并考......
立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器......
文中设计并实现了一个基于数据流的汇编代码CPU指令调度器.该CPU指令调度器基于中国科学院微电子研究所自行研发的Diamond处理器VLI......
随着社会信息化水平的不断提高,信息产业的快速发展,由此带来了能源的消耗也越来越高。特别是芯片集成度越来越高,系统应用越来越复杂......
魂芯DSP处理器是一款32 bit静态超标量、分簇结构的、支持SIMD的VLIW处理器。魂芯DSP芯片有4个执行簇和3个内存块,但簇间数据传输......
循环不变量外提是一种传统的优化算法.在现代编译器中,循环不变量通常在编译器的中端中被删除或外提.中端的中间表示是目标处理机......
随着嵌入式处理器在各个领域的广泛应用,嵌入式软件的复杂度越来越高。充分发掘嵌入式处理器的性能,需要高级编译优化技术的支持。指......
同时多线程处理器同时执行来自不同线程的指令,兼顾了线程内和线程间的指令并行,使处理器的性能得以大幅提升。然而这种对资源的共享......
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访......
对指令集进行扩展和添加新功能部件是提高处理器性能的有效途径.为了充分利用新的体系结构扩展,已有应用必需经过全新的优化编译.......
许多通用和嵌入式高性能处理器都支持谓词执行,利用谓词执行可以简化程序的控制结构,而且指令调度、寄存器分配也可以利用谓词提高效......
在开发指令级并行性的编译器中,如果代码优化和指令调度各自独立进行,将导致代码优化效果的下降甚至产生副作用.文中针对这一问题,提......
FPGA为加速计算密集型应用提供了一个灵活高效的平台.然而,由于片上资源有限,在一些情况下,需要将大规模应用中包括的多个循环程序分别......
应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源......
描述并分析了一种新型的VLIW(Very Long Instruction Word)机器模型,为充分利用该模型的并行特性,提出了基于静态单一赋值(SSA)表......
IME-Diamond处理器是一款VLIW结构的多核处理器,具有多个通道,可并行执行多条指令。为了充分利用多通道并行执行的特性,IME-Diamond处......
针对嵌入式系统软件设计过程中对编译器的可重定向性提出的新要求,提出了一种基于体系结构描述语言XpADL的可重定向编译器生成方法......
动态二进制翻译提供了无需重新编译源代码就能将源机器生成的可执行代码自动转换到目标机器的方法,很好地解决了代码兼容性问题。......
BWDSP100是一款采用16发射、SIMD、VLIW架构的32位高性能DSP,适用于雷达信号处理、电子对抗、通信及图像处理等领域.对这种体系结......
针对传输触发结构代码生成中的指令调度、多寄存器堆分配、全局寄存器分配和软件旁路等优化问题,给出一个整数线性规划形式化模型,并......
可重构指令集处理器能够适应多变的计算任务在性能和灵活性两方面的要求,而传统的编译后端技术无法为其生成高效的可执行代码,需要有......
基于传输触发体系结构可定制Tcore处理器具有理想的性能/价格比.但由于大量数据传输细节在体系结构一级可见导致了过低的编译效率.为......
针对编译器系统设计和编译中的低功耗优化,基于可重定向编译器,实现在编译器后端对VLIW指令总线进行功耗优化的策略.通过对编译生成的......
能耗是设计嵌入式系统不可忽视的一个重要方面.针对嵌入式设备主要能耗来源之一的总线能耗,提出了一种基于总线翻转编码的低功耗指......
指令调度是编译优化过程中的重要技术.对于VLIW机器来讲,由于机器性能与编译器的设计和实现有很大的关系,指令调度就显得尤为重要.......
期刊
超长指令字(Very Long Instruction Word,Vuw)处理器一般采用总线互连的多簇结构,每个簇中的功能单元共享一个本地寄存器堆,簇间采用总......
投机是指令调度克服指令间控制依赖的一种重要手段.投机一方面可以提高指令级并行带来性能改善,另一方面,它也可能拉长变量活跃区间,增......
为了有效开发 VLIW DSP 处理器的指令级并行性,提出一种基于寄存器压力差异化的超块调度算法。该算法在传统列表调度的基础上扩展调......
随着各种嵌入式智能设备的广泛普及和应用,人们生活质量得到了显著提升,然而由此引起的环境和资源问题也越来越严重。以低污染、低......
数字信号处理(digital signal processor,DSP)芯片具有强大的数据运算功能和高运行速度,为了充分利用芯片的硬件资源,需要对基于硬......
当前,大数据及人工智能技术向嵌入式系统发展,对嵌入式系统的存储访问能力提出了更高的要求.磁畴壁存储器凭借其高读写速度、高密......
现代超标量处理器通常设置有多套计算部件支持指令并行执行,以提高程序的运行效率。运算资源分配策略在很大程度上决定了处理器能......
随着处理器和存储器速度差距的不断拉大,访存指令尤其是频繁cache miss的指令成为影响性能的重要瓶颈。编译器由于无法得知访存指......