并行化编译中数据和计算的自动划分及优化技术研究

来源 :解放军信息工程大学 | 被引量 : 10次 | 上传用户:woainiwgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机是现代科学研究、工程技术开发和大规模数据处理的关键支撑技术。随着高性能计算机的发展,并行计算机的体系结构越来越复杂,并行程序设计的难度也越来越大。使用先进的并行化编译技术,自动将串行程序转换为等价的能在并行计算机上高效运行的并行程序,是克服并行计算机编程困难、软件难于移植的主要手段,是充分发挥高性能并行计算机潜能的有效途径。近年来,虽然并行化编译技术取得了可喜的进步,但仍有许多问题需要深入研究。在分布存储并行计算机上开发并行化编译器,碰到的第一个问题就是如何分布一个程序中的数据。分布存储并行计算机与共享存储并行计算机相比,最大的区别就是数据分散存储在不同的处理器上。使用分布存储并行计算机时,除了要考虑计算的并行性外,还必须考虑数据的划分问题。本文以并行化编译器S-KAP的研究开发为背景,针对目前在分布存储并行计算机系统上,开发并行化编译器时的数据和计算划分问题进行了研究,探讨了串行程序并行化过程中的数据和计算的自动划分及优化技术,实现了进行数据和计算划分的两级映射模型;1、数据和计算映射到一个规模不受限的虚拟处理器;2、虚拟处理器以BLOCK、CYCLIC、BLOCK CYCLIC(b)方式映射到物理处理器。本文针对分布存储并行计算机系统,首先研究了串行程序并行化时,过程内具有一致性数据分布的数据和计算划分问题;然后讨论了虚拟处理器到物理处理器的映射方式;最后探讨了分布存储并行计算机的数据和计算划分的优化。研究的主要内容和贡献包括;1.在分析Anderson和Lam算法的基础上,提出了一种改进的数据和计算划分算法,实现了无流水和无数据重分布通信的计算和数据划分,并验证了算法的有效性。2.针对邻近通信和负载平衡问题,给出了BLOCK、CYCLIC、BLOCK CYCLIC三种映射方式的选取策略,设计并实现了虚拟处理器到物理处理器的CYCLIC映射算法。测试表明,该算法能够实现负载平衡。3.基于改进的过程内具有一致性数据分布的数据和计算划分算法,以及精确的数组数据流分析,实现了具有DOALL和DOACROSS类型并行的嵌套循环的数据和计算划分算法。4.基于改进的过程内具有一致性数据分布的数据和计算划分算法,以及用符号系数不等式表示数据划分时的BLOCK映射方式,实现了只读数组的复制和边界冗余。引入此方法是在保证原有读写数组的并行度,并且不引入额外的数据重分布通信开销的基础上,实现只读数组的优化。测试表明,边界冗余有效地减少了通信的数据量,提高了程序的并行性能。
其他文献
在银行发展过程中,员工的异常行为是银行风险点之一,对员工异常行为排查可以切实做好案件风险的分析,减少可能存在的隐患。银行存在风险对银行安全以及发展会产生极大影响,因
在目前形势下硕士研究生的培养目标要适应我国社会主义市场经济体制,必须改变以培养“学术型”为主的旧观念,把“学术型”和“应用型”融合起来.本文从改革招生模式、优化培
基层农机管理服务中心对于农业现代化技术与发展有着积极的引导作用。分析基层农机服务管理工作现状,了解其存在的问题与不足,通过科学有效的方式探究完善对策,可以为农机管
目的:探讨血浆置换治疗重型肝炎的护理要点。方法:应用Plasauto—iQ血液净化装置对接受治疗的6例重型肝炎的患者进行血浆置换治疗。结果:治疗后患者的临床症状、生化指标、心理
合理确定生态补偿标准是生态补偿研究从理论走向实践的关键和难点。以川西A市为例,采用成本核算方法,计算当地从理论上应获得的生态补偿量。计算得到研究区域生态保护的直接
油脂降解缓慢是影响餐厨垃圾厌氧发酵的重要原因。应用脂肪酶强化餐厨垃圾厌氧产甲烷,探究了脂肪酶投加量、温度和pH对产甲烷的影响。结果表明,脂肪酶能够促进餐厨垃圾厌氧发
通过对16例健康老年男性练功者血清睾酮(T)、雌二醇(E2)及促黄体生成素(LH)的放射免疫测定和自身对照研究,发现练功6个月后,同自身练功前比较,血清T水平无显著变化,但血清E2及LH水平显
视频监控系统面临着一系列安全问题,频频出现视频监控假冒、窃取和非法控制事件。基于可信计算技术,设计了可信视频监控系统安全架构。该架构对系统中的计算设备实施可信安全
目的:探讨内镜下诊治大肠息肉的方法和疗效。方法:对185例大肠息肉病例经电子结肠镜下高频电刀切除等治疗并进行分析总结,随访者复查肠镜后评价疗效。结果:全部病例均治愈,未发生