面向大规模应用的多计算平台并行优化关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:wujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机的出现和快速发展,使其被广泛应用于云计算、安全、大数据处理等领域。据统计大数据处理占据了46%的份额位居榜首。存储结构的复杂多样,计算机体系结构的多样性以及大数据处理问题体量大、数据复杂多样等特点,高性能计算机在大数据处理领域的应用面临着巨大的挑战。本文主要研究多种存储结构下不同应用场景的异构并行算法和优化技术,选取了大数据处理中的迭代算法、高吞吐率需求、大规模网络融合三种典型的应用问题进行研究,分别从存储、通信、任务划分、并行性、矩阵向量运算、CPU+GPU异构等角度对不同类型的应用场景的并行算法和优化技术进行研究。本文的主要创新点概括如下:(1)提出了一种基于多级存储的并行SNF算法针对生物医学领域样本规模大、内存需求高的相似网络融合(SNF:Similar Network Fusion)算法,提出了一种基于分层存储的CPU+GPU异构并行优化算法para SNF(Parallel SNF)算法,通过矩阵/向量分块等方式提高了算法的Cache命中率;通过采用基于SSD+内存+缓存的三级存储模型,大大提高了SNF算法的可扩展性。实验结果表明,para SNF算法运算速度快、可扩展性高。(2)提出了一种无数据相关的高吞吐率异构并行指纹匹配算法针对数据库规模越来越大、实时性要求高、识别算法不断改进、存在较高的数据并发度的生物识别系统,本文以指纹识别为例,提出了一种优化的指纹识别系统框架。针对系统中的指纹匹配这一热点问题选取多核CPU+众核GPU的异构系统,从指纹模板的存储顺序、任务的调度、CUDA Stream等多个角度对匹配过程进行优化。实验结果表明,基于CPU+GPU异构的指纹匹配算法运算速度快,吞吐率高,能够满足系统实时性的要求。(3)提出了一种基于异步规约通信的分布式存储迭代并行优化算法本文以大规模三维重建中的SBA(Sparse Bundle Adjustment)算法为例进行研究,针对SBA算法在迭代优化过程中数据规模大、运算量大、存储需求高等问题,提出了一种与BA问题无关的分布式任务分配方案,并且对算法中的关键步骤进行多核并行优化,针对问题中的方程组求解问题,提出了一种基于异步规约通信的分布式DSBA(Distributed Sparse Bundle Adjustment)算法(A-DSBA:Asynchronous Sparse Bundle Adjustment)。大量的实验表明,本文提出的算法在保持算法精度的前提下,可扩展性高、运算速度快。
其他文献
现代战争的对抗,表现为作战力量及资源之间的系统较量。如何选择目标进行打击以达到有效击伤或瘫痪敌方体系是指挥决策的关键,因此使用体系思维进行目标分析事关军事行动成败。本文开展目标体系分析相关的理论和方法研究具有重要意义。传统的目标体系分析大多是基于建好的目标体系进行关键目标和部位的分析。但是现代战争对抗激烈,目标体系内部关系复杂且动态变化,同时受到战场“迷雾”影响,如何快速、高效、准确的构建出对方的
跳频(Frequency Hopping,FH)是一种典型的扩频通信方式,其在军事通信系统以及民用通信方面都得到了广泛的应用。跳频信号的载频在跳频序列的控制下,在一定的频带范围内伪随机跳变,从而达到扩展频谱的目的,并使其具有抗衰落、抗干扰、抗截获、易组网、多址能力强等优点。为了进一步提升跳频通信系统的性能,跳频带宽正逐渐加大,跳频速率也得到了大幅的提升,这使得跳频通信对抗面临更加严峻的挑战。目前,
到达角(DOA)估计是阵列信号处理的一个重要研究方向,其广泛应用在弹载被动阵列测角、语音信号处理、5G通信、射电天文等领域。随着现代信息技术的不断发展,DOA估计所面临的信号环境正变得日趋复杂。较高的测角精度和角度分辨力以及较低的计算复杂度往往是实际应用中所需要的,并且一些特定场景要求DOA估计算法具有二维测角能力、欠定DOA估计性能以及低信噪比、小快拍数下的适应能力。因此,本课题重点研究了雷达信
随着移动互联网、物联网及人工智能等技术的快速发展与智能移动设备的指数级增长,一些新型的低时延、高能耗的资源密集型移动计算应用应运而生,而资源密集型计算应用与资源受限的终端设备之间的矛盾日益突出。移动边缘计算将丰富的计算和存储资源部署在更靠近用户的无线接入网边缘侧,为用户提供就近计算迁移和任务执行服务,可有效提高计算服务响应时间、缓解终端设备的计算和能耗压力,被认为是解决上述矛盾的关键技术。然而,考
随着全球卫星导航系统的不断发展,越来越多的导航应用对高精度测量的需求不断提高。特别是干扰场景下的高精度测量问题已成为研究的热点。此外,多径误差也是制约卫星导航高精度应用的主要误差源之一。本文围绕干扰和多径场景下的高精度测量问题,从无偏干扰抑制、多径抑制算法性能评估与多径参数估计、干扰和多径联合抑制三个方面展开研究,主要工作和创新成果如下:(1)针对频域抗干扰算法会导致导航信号相关峰畸变问题,建立了
非合作双基地雷达探测系统由于具有“四抗”特性且成本较低,成为近年来雷达领域的研究热点。利用非合作雷达信号作为外辐射源的被动探测系统不仅提高了外辐射源雷达的探测威力性能,而且扩展了可利用的外辐射源种类。但系统的研究面临诸多问题和挑战,特别是系统探测过程中的杂波干扰以及低检测概率下的目标跟踪问题。本文围绕非合作双基地雷达的杂波干扰抑制以及目标跟踪关键技术开展了深入研究工作。主要内容概况如下:第二章分析
空间信息网络是构建未来全球数据通信业务的基础性平台,是天、空、地一体化的集成网络系统,能够为用户提供广域无缝的信息网络服务,在国防安全、航空航天、应急救援、智慧城市等多个领域都具有广阔的应用前景。与传统的信息网络相比,空间信息网络采用多星共轨、空地协同的网络架构来提升网络的传输、覆盖以及稳定性等能力。由于网络中节点种类多样、数量众多、功能各异,空间信息网络结构非常复杂,大大增加了网络体系结构设计的
在战场环境、灾害救援等应用中,由于各类干扰、破坏的影响,通信基础设施的可靠性难以保障,为信息的高效传输带来极大挑战。机会网络通过存储-携带-转发这种点对点通信模式,克服了传统移动自组织网络需要较为稳定的通信链路的局限性问题,提供了一种尽力而为式的鲁棒性通信策略。通过高效运用动态、稀疏的通信机会,机会网络可以深度挖掘并应用各类通信资源的能力,对于高动态不确定性环境下的信息传输具有重要意义。但是,机会
高分辨率成像是合成孔径雷达(Synthetic Aperture Radar,SAR)系统研制与应用的关键环节。SAR系统的高分辨率探测感知特点,有效提升了SAR在焦点区域信息获取和态势感知能力,使其成为军用和民用遥感领域重要的获取信息手段。与高分辨率SAR相适应的高精度高效成像算法、运动误差补偿算法、宽幅连续测绘体制设计等仍面临诸多问题与挑战。本文立足于SAR高分辨率应用需求,对高分辨率SAR的
多输入多输出(Multiple-Input-Multiple-Output,MIMO)技术和多跳技术能够通过引入空间分集对抗衰落并提高频谱利用率,进而达到提升系统容量、增强传输可靠性的目的,是目前研究的热点。为进一步提高MIMO技术和多跳技术的信息可靠性,本文在MIMO技术和多跳技术传输中引入混合自动请求重传(Hybrid Automatic Repeat re Quest,HARQ)协议,并以提