【摘 要】
:
现代微处理器提供了丰富的内存层次结构,包括各种级别的缓存和寄存器。其中一些内存(如主存、L3高速缓存)比较大,但速度很慢,并且在所有核心之间共享,其它的(寄存器、L1高速
论文部分内容阅读
现代微处理器提供了丰富的内存层次结构,包括各种级别的缓存和寄存器。其中一些内存(如主存、L3高速缓存)比较大,但速度很慢,并且在所有核心之间共享,其它的(寄存器、L1高速缓存)速度快,容量小并且只分配给一个小的内核。缓存大小一定程度上限制了高性能计算的性能。此外,由于层次存储结构各层结构之间的读写速度差异,导致高速缓存未命中次数成为影响高性能计算性能的另一因素。在本文中,我们考虑基本的线性变换算法,提出了一种具有缓存无关性质的原地线性变换算法。该原地线性变换算法允许计算得到的输出覆盖到输入上,在整个计算过程中只使用了O(1)大小的额外存储空间。本文首先介绍一个基于分块lower upper(LU)分解的原地线性变换算法,并表明所提出的算法具有高速缓存无关的属性。随后本文通过结合空间填充曲线对变换矩阵进行映射,给出了所提算法的循环版本。我们分析了该算法渐进意义下的高速缓存未命中次数,并给出了有关证明。变换矩阵为非方阵情况下的扩展算法在本文中也进行了讨论,并且分析了基于分块lower diagonal upper(LDU)分解的实现方式。本文同时给出了适合任意矩阵的基于permutation lower upper(PLU)分解的原地线性变换算法,通过使用空间填充曲线,使得该算法同样具有高速缓存无关的性质。最后,我们通过模拟实验对上述算法进行了性能测试并和已有算法进行了比较。仿真结果表明,本文所提出的原地线性变换算法相比现有原地线性变换算法有着更好的缓存利用率,平均性能提升达到30%以上,同时相比非原地算法,运行时内存消耗减小为50%。
其他文献
药品和个人护理品(PPCPs)包括非甾体类抗炎药(NSAIDs)和抗生素的大量生产和使用增加了水体中污染物的残留水平,从而污染了环境,也对生态系统和人类健康构成巨大威胁。光解及
盐酸林可霉素工业上又称为洁霉素,由从链霉菌的培养物分离得到。盐酸林可霉素是一种临床医学中常用的抗生素。目前国内对于盐酸林可霉素的提纯研究,主要通过改变溶剂,达到提
因各种现实情况安全工作的"尽职免责"存在困难,但即便如此如何在履职时尽可能的维护个人安全,值得每一个安全管理者认真关注。本文从完善"尽职免责,失职追责"企业安全监管机
并不是有了微信之后,才有朋友圈。在巴金生活的时代,也有朋友圈,也有自己的联系方法和交流方式。巴金是一位享誉海内外的文学大家,也是一位高产作家,更是一位杰出的社会活动
目的 :利用逆转录病毒载体制备CD19sc Fv-4-1BB-CD3z CAR-T细胞及CD19sc Fv-CD28-CD3z CAR-T细胞,等比例回输治疗一例2岁半难治、复发急性淋巴细胞白血病患儿,观察CAR-T的治
随着社会经济的飞速发展,企业的规模日益扩大、业务形态也多种多样,跨界、融合成为了时代关键词,国内涌现出了一大批组织庞大的集团型企业,它们往往采用复杂的矩阵式组织架构
随着物流业的快速发展,叉车的市场需求量也急剧增加。近年来,叉车逐渐朝着系列化、多元化、智能化方向发展。同一系列叉车门架的形状结构基本不变,仅因吨位不同在尺寸上略有差异。结合参数化设计技术对通用软件进行二次开发,定制专用产品设计系统,能够有效缩短产品设计周期。同时,在模型有限元分析与优化过程中,也存在大量重复性工作。将参数化设计思想引入CAE领域,能够实现分析与优化过程的参数化驱动。近年来,在同一软
近年来,受国家对新能源汽车的政策扶持以及下游锂电池生产企业尤其是国内、国际高端锂电池生产企业投资速度加快、规模扩大趋势的影响,锂电池产业保持持续增长。在政策之手和
日新月异的发展也使壁画的形式不可胜举,玻璃马赛克是壁画中存在的一种传统又新奇的材质。玻璃马赛克在壁画中的运用方式变幻无穷,如何将玻璃马赛克自身的材质与制作工艺巧妙
目的:报道1例儿童阴部粘蛋白病。方法:根据病史、临床表现及病理组织检查,诊断为儿童阴部粘蛋白病。结果:患儿女,7岁,因外阴部皮肤增厚发痒1年余,于2005年2月23日来我院就诊