【摘 要】
:
随着高性能计算在科学研究和海量数据处理中广泛应用,对高性能计算软件环境的完善成为了人们关注的焦点。编译技术作为软件和硬件连接的桥梁,对高效的编译技术的研究越来越受
论文部分内容阅读
随着高性能计算在科学研究和海量数据处理中广泛应用,对高性能计算软件环境的完善成为了人们关注的焦点。编译技术作为软件和硬件连接的桥梁,对高效的编译技术的研究越来越受到人们的重视。在申威处理器上进行LLVM编译器的编译技术研究对完善高性能软件环境具有重要意义。本文完成的主要工作如下:1.提出了锁机制编译策略,保证了多线程环境下原子操作的原子性,完善了申威处理器线程层的并行编译支持。在锁机制编译策略中,针对原子操作和申威处理器特性设计了52条伪指令;针对LLVM编译器特点,实现了原子操作语义映射流程;通过在锁机制算法中加入了对8位和16位数据类型的处理,完善了对申威处理器中小粒度数据类型的支持。2.基于有向无环图提出了不对齐数据的优化处理策略,在数据层挖掘了程序的并行潜力,完善了申威处理器数据层的并行编译支持。在不对齐数据的优化处理策略中,通过在有向无环图中进行节点的自定义降级处理完成了不对齐标量数据和不对齐向量数据的优化处理。本文对提出的编译支持策略进行了实验测试与分析。首先对锁机制进行功能验证和性能验证。实验结果显示,多线程环境下锁机制能够正确运行,C语言版NPB测试集程序平均加速比为8.08,最大加速比为13.32;Fortran语言版NPB测试集程序平均加速比为11.91,最大加速比为15.73。实验表明LLVM编译器加入锁机制编译策略后,通过使用Open MP库,在多线程环境下可以充分利用处理器的多核优势实现对程序性能的提升。其次,进行了不对齐数据优化处理策略的性能验证。不对齐数据进行十亿次存取时,不对齐向量数据优化后的最大加速比为14.01,平均加速比为13.61;不对齐标量数据优化后的最大加速比为20.27,平均加速比为14.49。实验表明在程序包含不对齐数据时,不对齐数据的优化处理策略能够实现程序性能的提升。
其他文献
21世纪以来,随着互联网技术的快速发展和多媒体技术的日趋成熟,网络视频点播日受欢迎。但是随着网络的发展,特别是在数据流量方面的日益增长,传统的视频点播存在视频画面不清晰、跳帧、连续性差等一系列用户体验不良好的问题,除了网络带宽低、拓扑结构复杂、视频数据冷门等原因外,产生这些问题的关键是基于TCP/IP的通信模式为基础架构的互联网存在严重资源浪费的问题,即当前的互联网上发生了大量的重复(冗余)传输。
近年来,随着物联网应用的快速发展以及市场需求的增大,传统的物联网无线通信技术如Wi-Fi、蓝牙、Zig Bee等已经无法满足大规模应用部署的要求。物联网低功耗广域网LPWAN(Low-
基于表面等离子体共振的光纤传感器是一种新兴的传感器,其具有高灵敏度、高分辨率、响应速度快、抗干扰能力强等优点,在环境监测、生物医学等领域具有很广泛的应用前景。本文
随着计算机网络,通信技术和电子技术的快速发展,信息传播已经取得迅猛的发展。其中数字图像和视频作为信息的主要载体,是人类获取和交换信息的主要来源。数字图像的相关研究
电容层析成像(Electrical Capacitance Tomography,ECT)技术是自20世纪80年代借鉴医学CT技术发展起来的一种成本低廉且安全性能高的新型流动层析成像技术。它可以在不破坏封
无线可充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)中,如何设计合理的路由协议,关系到节点能量动态平衡以及数据传输路径稳定性,进而影响网络的生命周期。
随着互联网信息技术的发展,各种网络服务层出不穷,使得互联网体系结构中的僵化问题日益严重。网络虚拟化技术可以使得在不改变底层物理网络架构的情况下,让多重异构的虚拟网络成为可能,现已成为解决未来网络架构的重要因素。作为网络虚拟化技术的关键,近年来对基本网络切片问题即单域虚拟网络映射问题的研究已取得了一些瞩目的成果,但随着网络服务的更新换代,单域网络片逐渐无法应对人们的需要。底层跨越多个自治域的网络切片
随着大数据技术的快速发展,用户拥有的数据量越来越大,这些海量的数据可能会超出个人用户所拥有的存储能力,导致用户难以实现将海量数据完全存储到本地这一目标。在这种背景
内生经济增长理论认为,创新是经济增长的内在源泉和不竭动力。近年来,以资本要素投入、资源环境消耗为代价的经济发展方式已经无法满足我国经济持续健康发展的需求。优化经济
在机械制造的自动化背景下,轴类零件安装间隙的快速重复检测是机械行业内的一类重要研究课题。目前,国内大多数企业对于轴类零件安装间隙的检测主要依赖人工完成,人工检测成