面向图搜索的流加速部件片上数据通路的设计、实现及性能优化

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:hikerqw2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息社会的飞速发展引发了数据规模的爆炸式增长,大数据问题逐渐引起了研究者的广泛关注。然而,大数据问题表现出与传统科学计算问题不同的负载特性,使得通用处理器面临严峻挑战。图问题是大数据中的典型问题,在分析大数据集中数据对象间的关系中扮演着重要角色,尤其是以BFS算法为代表的图搜索算法,更是广泛存在于社交网络、人工智能等众多领域。考虑到流处理器高性能、高效能等特点,探索基于流体系结构解决图搜索大数据问题具有重要的意义。因此,本课题以特定的流加速部件为研究平台,面向图搜索大数据问题,研究其片上数据通路的设计和优化。针对该流加速部件,本文在深入分析其执行图搜索算法时负载特性的基础上,重点研究了其片上数据通路的设计与优化,主要从以下四个方面展开研究:第一,针对已有流处理器中的SRF数据通路,分析其在解决图搜索问题时多线程访问SRF激烈竞争的不足,提出了多体多控制器的SRF结构,增加SRF的并行度,并基于AXI协议实现了SRF中的体与处理器中的核之间的交叉互连。该数据通路能够均衡处理多线程访问SRF的请求,且具有较好的吞吐带宽,有效适应了处理器核对SRF的细粒度访问。第二,通过深入分析该流加速部件在执行图搜索算法时访问SRF的负载特性,进一步优化SRF数据通路,提出了处理器核私有SRF中的体方法,避免了它们之间复杂的交叉互连,提升了流加速部件的整体性能。第三,分析已有流处理器中的访存数据通路,针对其不适合多线程细粒度访存的问题,设计了基于消息包的高并发、低延迟的访存数据通路,该方法不仅能够均衡处理各线程的访存请求,而且也具有较好的访存带宽和延迟,满足了多线程处理图搜索问题的需求。第四,针对图搜索算法中共享数据一致性的问题,首先探索了通过加解锁SPM来维护一致性的方法,但发现该方法会导致访问SPM的激烈冲突。然后,进一步研究了多线程执行图搜索算法时访问共享数据的特性,提出了在访存数据通路中加入事务型访存的机制,通过原子性操作内存中的共享数据来保护其一致性,避免了频繁访问SPM的冲突。同时,也设计了该模块高效并发的访存接口。该方法有效减小了多线程竞争访问共享数据的阻塞时间,提高了线程间的并行性,增加了内存的带宽利用率,使得该流加速部件的整体性能得到提升。
其他文献
椭圆曲线密码系统的安全性建立在椭圆曲线离散对数问题的难解性上。同其它公钥密码系统相比,它的执行速度快、密钥长度短、安全性高,因而日益受到人们的关注,成为公钥密码学
WWW(简称Web)和无线局域网是近年来发展最快、最激动人心的网络技术。Web由于其操作简便、功能丰富,使得Internet真正实现了大众化。与此同时,无线通信技术迅速普及,越来越多的
随着信息化时代的发展,各种各样的数据随之而来,数据结构多样化以及数据规模对相关技术提出了巨大挑战。对于处理大数据的许多应用,MapReduce编程框架的优势很明显,在谷歌、
在分布式存储系统中,基于纠删码的容错机制相比于基于副本的容错机制能够极大地节省数据存储开销。然而,纠删码修复所产生的大量数据传输影响了系统性能,阻碍了纠删码在实际
发展智能安防系统,是解决城市化过程中出现的人民生命和财产安全威胁、重大安全事件后期数据排查处理困难等问题的有效途径之一,是未来安防系统的主要发展和研究方向。基于视
网格计算系统就是将地理分布、系统异构、性能各异的各种资源,包括超级计算机、大规模存储系统、个人计算机、各种设备等组织在一个统一的框架下通过高速互连网络连接并集成
测试驱动开发(Test-Driven Development,简称TDD)是一种可预测的软件开发方法,它是敏捷思想的重要体现,是极限编程的技术核心。它不仅在极限编程中广泛应用,同时也适用于其它开发
文件系统作为操作系统的重要组成部分,决定了操作系统本身信息和用户数据在存储设备上的组织方式。随着嵌入式系统硬件设备的普及和价格的不断降低,以及嵌入式系统应用领域的不
伴随着大数据时代的到来,数据呈爆炸性增长。如何有效地组织海量数据并从中提取有价值信息成为一个难题。深度学习模型是一个多层的神经网络,模拟了大脑皮层的层次学习结构,
入侵检测是一种能检测任何企图破坏资源完整性、保密性和可用性等入侵行为,并能采取对抗措施的技术。在网络安全问题日益突出的今天,如何迅速而有效地利用入侵检测系统发现各种