论文部分内容阅读
近年来,信息社会的飞速发展引发了数据规模的爆炸式增长,大数据问题逐渐引起了研究者的广泛关注。然而,大数据问题表现出与传统科学计算问题不同的负载特性,使得通用处理器面临严峻挑战。图问题是大数据中的典型问题,在分析大数据集中数据对象间的关系中扮演着重要角色,尤其是以BFS算法为代表的图搜索算法,更是广泛存在于社交网络、人工智能等众多领域。考虑到流处理器高性能、高效能等特点,探索基于流体系结构解决图搜索大数据问题具有重要的意义。因此,本课题以特定的流加速部件为研究平台,面向图搜索大数据问题,研究其片上数据通路的设计和优化。针对该流加速部件,本文在深入分析其执行图搜索算法时负载特性的基础上,重点研究了其片上数据通路的设计与优化,主要从以下四个方面展开研究:第一,针对已有流处理器中的SRF数据通路,分析其在解决图搜索问题时多线程访问SRF激烈竞争的不足,提出了多体多控制器的SRF结构,增加SRF的并行度,并基于AXI协议实现了SRF中的体与处理器中的核之间的交叉互连。该数据通路能够均衡处理多线程访问SRF的请求,且具有较好的吞吐带宽,有效适应了处理器核对SRF的细粒度访问。第二,通过深入分析该流加速部件在执行图搜索算法时访问SRF的负载特性,进一步优化SRF数据通路,提出了处理器核私有SRF中的体方法,避免了它们之间复杂的交叉互连,提升了流加速部件的整体性能。第三,分析已有流处理器中的访存数据通路,针对其不适合多线程细粒度访存的问题,设计了基于消息包的高并发、低延迟的访存数据通路,该方法不仅能够均衡处理各线程的访存请求,而且也具有较好的访存带宽和延迟,满足了多线程处理图搜索问题的需求。第四,针对图搜索算法中共享数据一致性的问题,首先探索了通过加解锁SPM来维护一致性的方法,但发现该方法会导致访问SPM的激烈冲突。然后,进一步研究了多线程执行图搜索算法时访问共享数据的特性,提出了在访存数据通路中加入事务型访存的机制,通过原子性操作内存中的共享数据来保护其一致性,避免了频繁访问SPM的冲突。同时,也设计了该模块高效并发的访存接口。该方法有效减小了多线程竞争访问共享数据的阻塞时间,提高了线程间的并行性,增加了内存的带宽利用率,使得该流加速部件的整体性能得到提升。