循环展开相关论文
针对计算机平台在图像处理过程中面临的高能耗问题,研究了电网巡检故障图像识别的低功耗神经网络加速方法.采用直接映射方式将卷积......
当前的MD5解密算法无法适应申威架构,不能充分发挥申威26010众核处理器的性能优势.针对上述问题,采用散列初始化、循环展开、链接......
作为数字信号处理领域的专用处理器,DSP被广泛应用于各种信号处理机上,由于其应用场景多为要求效率高且实时性高的场景,当前流行的......
过去几十年编译器的优化主要使用的是人工调优的方法。随着计算机体系结构的不断发展,编译器的优化变得更加复杂。编译器人工调优......
随着信息技术的发展,人们需要解决的问题越来越复杂,传统的串行程序设计方法已经无法满足许多应用领域的需要,于是并行计算机和并......
快速傅里叶变换(Fast Fourier Transform,FFT)是数字信号处理领域的基础算法之一,在科学计算、图像处理等方面有着广泛的应用。申......
伴随着音视频娱乐行业的迅速进步,数字信号处理器正逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能......
如果要用“气势磅礴”来形容一个国际影展,那么,笔者认为非奥地利超级国际摄影循环展莫属.奥地利超级国际摄影循环展开始于1992年,......
提出了一种在高性能RISC芯片上进行图象中低层处理的寄存器优化方法。使用该方法能使处理速度提高将近一倍,在TMS320c40上所做的实验表明应用该方......
在研究超长指令 (VL IW,Very L ong Instruction Word)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构体征和......
软件流水是开发指令级并行性的重要方法之一.IA-64是支持软件流水的EPIC(显式并行指令计算)体系结构.通过对NAS Benchmarks和Media......
为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进......
对智能规划中的通用规划思想及方法进行了全面综述。通用规划是对特定的规划领域制定通用的解形式,从而可以不通过搜索而直接得到......
在软件流水中应用循环展开可以实现分数值的启动间距,提高资源的利用率,同时基于展开的优化技术可以降低程序的资源需求和关键路径......
谓词执行是在控制流存在的条件下可以有效挖掘指令级并行性的硬件机制,而在分簇结构上实现谓词机制,可以提高分簇结构上条件的执行......
软件流水线通过重叠连续的循环实体来实现有效的精细调度.然而,其性能可能受限制于循环里缺乏足够的并行操作或者资源需求."先展开......
塔式起重机结构有限元分析中,静力方程求解器是分析程序的核心。随着塔机求解规模的增大及对求解速度的高要求.传统的直接求解器愈显......
执行效率是衡量DSP程序的性能的重要指标,因而程序的优化就显得十分必要.在TS201的环境下,基于汇编语言,结合MTI(动目标显示)的程序对SIM......
循环展开是一项常用的循环优化技术。当前针对串行程序的循环展开技术已经比较成熟,但是在实际应用中没有针对向量程序进行有效的......
针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子......
为高效实现H.264多模式帧内预测,解决其计算复杂度高造成的计算压力,本文根据H.264帧内预测算法的计算密集与数据并行的特征,基于流处理......
滑动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点.可重构硬件为滑动窗口应用提供了一个灵......
提出了一种自动检测C语言程序中是否含有死循环的方法.该方法基于程序分析技术,包括循环展开和路径可行性分析技术.该方法首先通过遍......
软件流水是开发循环程序指令级并行性的技术,它通过并行执行连续的多个循环体来加快循环的执行速度.在软件流水中,循环体的重叠增......
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体和科学计算等领域程序的数据级并行.当前,两种基本的向量发掘方法分......
循环展开问题一直是过程式值言部分求值和广义部分求值的一个难题。笔者基于数据流分技术,提出了一个部分求值或广义部分求值的循环......
2.产品控制业务主线第二条业务主线是产品控制。第二条业务主线比较容易理解,它是沿着产品控制的循环展开的,就是产品的全成本控制......
软件流水和循环展开是开发循环并行性的两种重要编译优化技术.IA-64是支持软件流水的EPIC体系结构.论述了在IA-64编译器中结合使用......
为充分利用嵌入式多核ARM微处理器体积小、功耗低、成本低、性能高的优点,以此提高程序响应速度,研究ARM体系结构及基于该体系结构......
立体匹配是计算机立体视觉中最重要的步骤之一,由于计算量巨大,使得在各种实时应用中,都必须解决立体匹配的优化问题。立体匹配的......
为提高GUI自动化测试的覆盖率、故障定位的速率和精度,以及检测由于时空变化导致的空间错误引起的故障,建立基于运行监测的GUI自动......
超字并行(SLP)是一种针对基本块的向量并行发掘方法,结合循环展开可以发掘更多的并行性,但同时也会产生过多的发掘路径。针对上述......
针对BWDSP100体系结构特点,基于循环展开、指令调度以及软件流水等并行优化技术,结合多簇超长指令架构的特点,通过使用超算硬件指......
OpenCV(Open Source Computer Vision Library)是能够实现有关图像处理和计算机视觉方面的跨平台计算机视觉库,该视觉库中包含很多......
H.264是最新的视频编码标准,具有非常优良的编码性能,但它的算法复杂度也很高,很难满足实时应用的需要。论文详细分析了影响H.264解码速......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
代码体积是优化存储资源有限的嵌入式系统的重要因素之一。针对该特点,使用oprofile性能分析工具,以EEMBC基准程序集作为工作负载,提......
分析归并排序算法和快速排序算法,根据国产CPU龙芯3A的体系结构特性,提出2种优化算法并进行实现。综合利用访存特性,引入拷贝优化......
EPIC是一种显性并行指令计算体系结构,主要思想是利用编译器和处理器的协同能力来提高指令级并行度。软件流水是开发循环程序指令级......
无线通信与视频图像处理等应用领域的快速发展对数字信号处理器(DSP)的性能提出了较高的要求。DSP因具有数据处理能力强大、可编程......
为提高编译器循环展开因子计算的准确性,提出一种基于改进的随机森林模型预测循环展开因子的方法。对传统随机森林模型进行加权的......
描述了开源高性能编译器Open64及向量化框架,给出了多循环层进行依赖关系分析算法和收益分析方法。结合面向DSP架构的SLP向量化框......
在DSP项目开发中,代码优化是非常重要的环节。本文针对TI公司C6000系列DSP处理芯片的结构特点,阐述了基于C6000硬件结构特点的C语......
并行程序设计与并行计算机的体系结构密切相关,因此其复杂性要远远大于串行程序设计.介绍了数据分解和循环体依赖等概念,提出了一......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进行嵌......
静力方程求解器是有限元分析程序的核心.随着求解规模的增大,求解器往往成为其工作的瓶颈.目前大量有限元程序采用的是一维变列高......