面向自主处理器的图算法优化关键技术研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:zwzwzrzr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和大数据时代的到来,数据信息的产生速度十分迅速。图作为一种对大数据进行处理的有效手段已经获得学术界和工业界的一致认同,基于图计算的技术可以有效地从海量数据中提取关键信息,但同时对计算能力的需求也急剧增长。目前已经有很多的研究工作基于X86 CPU和GPU架构对图算法进行加速,并且取得了很好的效果,而基于ARM架构进行图计算优化的工作还相对较少。ARM处理器已经在高性能计算和终端计算设备中广泛使用,2020年日本研制的超级计算机Fugaku(富岳)登顶并蝉联TOP500,将极大促进基于ARM架构的计算系统在应用中的使用和发展。因此,研究基于ARM架构的图算法优化技术正当其时,也十分必要。本文主要从两个方面开展基于ARM架构的图计算优化研究。首先,本文基于ARM架构对Kruskal和Prim算法进行了优化并提出了基于最小生成树的Graph500 BFS验证算法。为了加速验证过程,在数据结构和算法层面做了相应的优化,使用CSR格式存储稀疏图,在减少存储空间的同时加速数据的访问,函数以CSR稀疏图和BFS生成树作为输入,对BFS生成树生成边(源顶点、目标顶点、权重)集,根据该边集以相应的逻辑做进一步的判断,进而验证BFS生成树的正确性。在FT-2000+多核高性能处理器单机平台和集群系统上对优化前后的Kruskal、Prim算法和原始验证算法进行了测试与对比,结果表明Kruskal算法能加速Graph500 BFS生成树的验证环节,在一定程度上能保障程序的可靠稳定运行。其次,本文在ARM架构下对采用顶点编程模型的Graph Mat进行性能测试分析和优化。本文对Graph Mat框架计算模式和访存方式进行特征分析,并对各个部分的执行时间占比进行了详细统计和分析。发现Graph Mat在FT-2000+上的性能瓶颈主要是多核利用效率低下和远程数据访问。针对这一发现,本文提出并实现了基于虚拟多节点的多级并行和基于核关联的数据局域性开发优化策略策略,实验结果表明,优化后程序的性能得到了较大的提升,在比较耗时的SPMV阶段效果更佳。此外,在四种图算法上对本文提出的优化方式进行了性能和扩展性测试,Graph Mat在FT-2000+/64核处理器平台上的性能优异且扩展性可达到41.3倍的加速比。
其他文献
植物多样性如何影响生态系统功能是近年来生态学的研究热点问题之一,但是,当前的研究多集中在物种多样性与生态系统生产力关系的维持机制方面,而关于植物功能多样性与生态系统物质循环关系的研究较少。凋落物分解是物质循环和能量流动过程的重要环节,探究植物功能多样性与不同功能策略植物凋落物分解的影响,有助于揭示植物功能性状差异在物种多样性与生态系统功能关系维持中的重要性。本研究以浙东森林8个常见树种无患子(Sa
植被作为陆地生态系统的重要组成部分,支撑着自然环境和人类社会的可持续发展。随着全球变暖和人类干扰加剧,中国不同生态系统间的植被动态变化出现了时空分异。科学定量分析植被-气候-人类之间的关系,对制定应对气候变化的策略、实现区域生态系统可持续具有重要意义。为此,本研究以中国生态系统研究网络(Chinese Ecosystem Research Network,CERN)5种生态系统类型(草地、荒漠、农
小麦(Triticum aestivum L.)是我国的主要粮食作物之一,选育高产、抗病、优质的小麦新品种是保障小麦生产安全的重要手段。近20年来(1997-2016年),作为我国小麦六大主产区之一的四川麦区审定了约165小麦新品种,这些品种为四川小麦生产做出了突出贡献。本研究以四川省审定的156份小麦新品种和77份四川地方品种组成的四川小麦种质群体为研究对象,在多环境下对其农艺性状和籽粒性状表型
BIM技术作为现阶段信息化技术与建筑业结合的产物之一,在近些年已经逐渐发展成为工程领域的重要研究与发展方向。在中国,随着国家BIM相关政策的不断助力以及项目业主方的需求,推动了中国项目建设者对BIM技术的应用,使其在项目的进度、质量、成本、安全以及合同管理等方面逐渐发展,特别是实施BIM技术的优势用于施工进度管理也在相关研究者的不断研究与众多实践案例之中展现开来。尽管如此,由于BIM相关法律及标准
珠芽魔芋(Amorphophallus muelleri)是一种可用于提取葡甘聚糖的魔芋属植物,现已逐步被引种栽培和推广。但是珠芽魔芋为阴生植物,与大多数魔芋属植物一样难以适应夏季大田高温强光的生态环境。当前对珠芽魔芋的研究和驯化工作不多,我们对其在大田中对夏季强光逆境的胁迫响应仍了解较少。同时,水杨酸作为一类与植物抗逆有关的激素,在许多研究中被广泛验证了其对植物的逆境响应具有促进作用,但其对于珠
目的阿替普酶(recombinant tissue plasminogen activator,rt-PA)静脉溶栓早期疗效分析对于提示急性缺血性卒中(Acute ischemic stroke,AIS)患者血管再通及远期预后具有重要意义,本研究旨在通过回顾我院既往阿替普酶静脉溶栓干预患者,筛选静脉溶栓早期疗效影响因素,建立溶栓早期疗效回归预测模型,对模型进行评价和应用实践,指导溶栓干预,提高AI
探测电极是海洋电场探测装置的重要核心部件,其中Ag/AgCl电极由于具有高稳定性、低自噪声的特点,而作为探测电极广泛应用在各种海洋信号探测中。本文针对目前Ag/AgCl电极在测试时出现电位稳定速度慢、固相结构腐蚀粉化、强度差以及自噪声变大等问题,分别从前驱粉体的制备工艺、电极的组分及结构等方面对其进行了优化研究。首先,从球磨时间、干燥方法、表面活性剂修饰三个方面对AgCl粉体进行优化;其次,通过添
世界上多年冻土地区修建铁路已近百年历史,但目前运营线路的病害率仍在30%左右。自2006年7月1日青藏铁路开通以来,多年冻土路基的沉降变形问题便一直困扰铁路养护部门,高原冻土与进藏列车安全的矛盾日渐凸显,部分病害处理措施效果有限,如何保持路基热平衡和稳定性是一个科学难题。鉴于此,本文以多年冻土路基病害防治理论完善为背景,以青藏铁路北麓河高温高含冰量冻土场地普通路基为例,研究了动静荷载作用下青藏铁路
小麦(Triticum aestivum L.)是最重要的粮食作物之一。从古至今,干旱一直影响我国乃至世界农业发展。人工合成六倍体小麦(SHW)拥有大量响应干旱胁迫的基因,合理利用这些基因将有助于培育小麦耐旱品种。本研究通过SHW-L1×川麦32 F9重组自交系群体(SW群体),利用PEG-6000模拟干旱胁迫的水培法,考察供试小麦苗期耐旱相关根系性状。运用SPSS进行Pearson相关性分析和主
在全球尤其是中国西南地区豆科与非豆科作物间套作模式被广泛应用,间套作具有抑制杂草、控制病虫害、提高土壤肥力和氮素吸收的作用。然而,在该系统中,玉米植株改变了大豆的微环境,同时使大豆暴露在许多非生物胁迫下,包括光照胁迫(荫蔽)和水分胁迫(干旱),这些影响着间套作系统。遮荫和干旱被认为是限制作物正常生长的最严重的非生物胁迫因子,尤其是干旱和半干旱地区的高密度间套作作物。然而,这两种胁迫因子的交互作用与