【摘 要】
:
压缩感知理论打破了传统奈奎斯特采样定理对采样率的限制,它在信号具有稀疏性的前提条件下,以较低的采样率实现对信号的压缩采样。压缩感知提出后,在无线通讯、阵列信号处理
论文部分内容阅读
压缩感知理论打破了传统奈奎斯特采样定理对采样率的限制,它在信号具有稀疏性的前提条件下,以较低的采样率实现对信号的压缩采样。压缩感知提出后,在无线通讯、阵列信号处理、模式识别和生物传感等领域得到广泛关注。压缩感知重构方法通常具有较高的计算复杂度,在信号尺度较大时,压缩感知重建需要的时间会急剧增长,导致大尺度信号压缩感知重构的实时性难以满足需要。压缩感知重构算法的加速实现已成为该领域关注的重要问题。随着基于CUDA架构的图形处理单元(GPU)的推行,最初用于图像加速、处理图形转换和渲染等工作的GPU在高性能计算方面得到大量应用。考虑到图形处理器高效的并行执行能力,以及在大尺度并行数据处理上具有的良好加速潜力,本文探讨了基于GPU的压缩感知重构算法的加速方法与实现技术。论文重点对三种压缩感知重构算法(OMP算法、BP算法和A*OMP算法)进行了分析与比较,以及在对算法模块的并行性进行可行性分析的基础上,探讨了在GPU平台上对OMP和A*OMP两种重构算法耗时长模块的并行加速设计与实现,以有效提高大尺度信号压缩感知重构的实时性。本文的主要研究工作及创新如下:(1)研究了基于图形处理器的OMP算法的加速方法及实现。为降低中央处理器与GPU之间传输的延迟,研究了将OMP算法的迭代过程转移到GPU上并行处理的方法。在GPU端,根据全局内存的存取特点改进CUDA程序,以便使存储器的存取满足合并访问条件,从而降低访问延迟。利用流多处理器(SM)的丰富资源,合理分配SM中共享内存,改进线程访问有效降低区冲突,大大提高数据访存速度。(2)探讨了A*OMP算法的并行实现及基于GPU的加速方法。通过将耗时长的矩阵逆运算转化为可并行的矩阵/向量乘运算,并考虑算法内在的相关性,提出一种迭代实现方法以降低计算复杂度。将算法中的矩阵/向量计算映射到GPU上并行执行,利用Jacket并行编程功能有效提升系统加速性能。
其他文献
近年来随着城市经济的发展与规模的壮大,城市轨道交通迅速发展,地铁车站深基坑的施工难度也在不断增加,因设计或施工不当引发的深基坑失稳安全事故时有发生。本文以福州地铁4、5号线“L”形换乘车站洪塘路站深基坑工程为研究背景,通过数值模拟与现场监测的方法,研究洪塘路站深基坑工程施工过程中的受力变形规律,分析其在施工过程中的稳定性。主要研究内容与成果如下:(1)采用MIDAS GTS软件对深基坑的开挖过程进
为实现中国兵器工业集团公司的战略决策,根据本集团制定的信息化建设规划与要求,围绕全面提升集团管理信息化水平的建设思路,对集团人力资源业务主管部门开展了针对性的信息
许慎在《说文解字》中解释“毓”为“养子使作善也”,这与初文“毓”的基本含义是有出入的。回到汉字创作之初,“毓”字的甲骨文叙述了带有血水的婴儿刚刚从母亲的肚子里倒立
目的探讨直肠癌患者CT灌注成像的各项参数对直肠癌术前评估的价值方法选经根治性手术治疗且病理证实的直肠癌病人30例为研究对象,所有病人于术前行CT灌注成像扫描,准确记录血
DNA自组装计算凭借其海量存储能力、高度并行性和超低能耗这三个强大的优势,使其在各种不同的算法中脱颖而出,成为解决NP难问题和组合优化问题的一种潜在方案。相比于传统的
STEM教育是一种旨在培养综合型、创新型人才的教学形式,这一教学形式也顺应了当前培养学生核心素养的新课程改革目标。然而,目前我国的STEM教育还处于套用国外教学模式的阶段
随着互联网技术的迅猛发展和通信业务拓展的多样化,用户对通信技术的要求越来越高,尤其在高数据传送速率方面。当前在研究LTE的基础上提出了LTE-Advanced后续演进系统的研究,
目的探讨二维斑点追踪成像(speckle tracking imaging,STI)在评价不同剂量的蒽环类化疗药物(anthracycline,ATC)对乳腺癌患者心功能早期损害的应用价值。方法选择80例乳腺癌
历史影像资料经过长时间的存储会因胶片老化、破损等问题产生音频噪声,导致音频质量低、听感不佳,因此需要对这些历史文物进行修复。目前这一领域出现了许多较为有效的修复方
传统的推荐系统(Recommendation System,简称RS)可以通过用户、项目的历史评分记录来学习到用户潜在的个性化偏好和项目潜在属性特征,从而帮助用户快速准确地定位到目标内容