论文部分内容阅读
伴随着计算机技术的迅速发展,数字图像处理技术在天文学、生物学、核医学、法律实施、国防科技、工程制造等领域发挥着重大作用。在应用中人们对图像处理技术提出了新的要求:即大规模图像数据的处理和实时处理。为了满足需求,研究人员将并行计算与图像处理相结合,发展出并行图像处理技术。在性能各异的并行计算平台中,英伟达(NVIDIA)公司推出的计算统一设备架构(Compute Unified Device Architecture, CUDA)因为充分利用GPU (Graphic Processing Unit)强大的计算能力实现了通用并行计算而受到研究者们的青睐o CUDA也成为了图像处理领域新的研究热点。本文的研究重点是CUDA环境下的性能优化策略,在这些性能优化方法的指导下实现图像处理的并行化,获得特定条件下的最优性能。首先对已有的并行计算和并行图像处理技术进行了总结,详细介绍了CUDA的编程模型及其软硬件架构。讨论了CUDA环境下的多种性能优化策略,并做了细致的理论分析。然后介绍了GPIP (GPGPU Image Processing)编程框架和基于CUDA的并行图像处理关键技术。以图像形态学腐蚀膨胀算法和开闭运算为例,在CUDA架构上实现了并行化处理,并依据本文所提出的优化算法完成了性能优化。在此基础上,本文做了详尽的实验,实验结果证明本文的优化算法可以有效指导图像处理在CUDA架构上实现并行化,同时获得特定条件下的最优性能。