论文部分内容阅读
由于噪声和干扰的存在,信号在传输过程中往往会发生差错,这样,如何在有噪信道中高效而可靠地传输信息成为了数字通信系统必须要解决的问题。信道译码器的主要任务在于以尽可能小的译码错误概率从接收序列中恢复出原本的发送码字。低密度奇偶校验(LDPC)码是一组用稀疏校验矩阵定义的线性分组码,它具有较低的编译码复杂度,并且引入迭代译码思想,能够获得接近于Shannon极限的译码性能,这使得它对包括Turbo码在内的很多种码呈现出了巨大的竞争力。LDPC码分为非规则码和规则码两种,前者的性能往往优于后者,但其编译码复杂度也较大。在编码设计时,消除短环有助于提高译码性能。消息传播算法是一种软判决译码算法,它体现了迭代译码思想,性能高于硬判决译码算法,但实现也较复杂。LDPC码性能优越,允许全并行高速译码,已经在个人数字设备、移动无线通信等领域显示出了很大的应用价值,极可能取代Turbo码成为第四代移动通信(4G)的首选编码方案。另一方面,快速发展的半导体工业使计算机系统内的处理器性能及数目逐日提升。GPU具有多处理器特性,与现有的多核CPU相比,其处理器的数目更多、整体的处理能力更高,这是由于GPU内部更多的晶体管被用作数据处理而不是流程控制。几乎每一代GPU的计算能力都大大超过同期的顶级CPU。现在的GPU可以被视作一个强劲的大规模并行计算设备。因此,人们提出了GPU通用计算(GPGPU)思想,即在很多非图像领域释放GPU的强大运算能力。GPU的可编程性为高效解决一些通用任务提供了新的思路,它可以被看作一个高性能计算设备,适合基于桌面平台进行大规模超级计算,完成海量数据的实时分析与处理。由于GPU传统上是为图像渲染而设计的,在将它用于通用计算时存在一些限制。目前,GPU只适合处理那些可以被看成并行计算的问题。早期的GPU编程大多建立在图像渲染语言如Direct3D、OpenGL等的基础之上,要求程序员对图形硬件架构和计算机图形学等方面的基本知识有所了解,只能借助图像语言实现非图像功能,代码编写不是非常容易。CUDA(Compute Unified Device Architecture)平台是NVIDIA公司近期提出的一种新的实现GPU通用计算的软硬件架构,基于CUDA平台程序员可以写出类C风格的代码来启动大量的GPU线程并行工作,因此它为解决很多计算密集型问题提供了一个高效而用户友好的开发环境。由于LDPC码的迭代译码算法适合全并行实现,本文基于CUDA平台分别按照构造并行级联校验矩阵的编码思想和IEEE 802.16e标准定义的编码方案提出和研究了AWGN信道条件下的LDPC码的译码实现方案。仿真实验对LDPC码译码的CPU实现和CUDA实现的性能作了详细比较和分析。研究表明CUDA能够带来明显的性能提升。