论文部分内容阅读
差异蛋白质点提取是蛋白质组学的重要研究方法之一,是凝胶图像分析的关键技术,能为药物研制、环境污染分析和疾病诊断提供重要依据,而蛋白质点检测是差异蛋白质点提取的核心步骤。针对现有的蛋白质点检测方法检测效率不高的问题,本文根据GPU统一计算架构(CUDA,Compute Unified Device Architecture)模型,利用GPU并行线程特点,对2D-GEL图像蛋白质点检测方法进行快速实现方法研究,主要研究内容和成果如下:(1)概述了CUDA高性能并行计算体系。首先简叙了CUDA程序的构成和CUDA协同计算机制;其次详细阐述了CUDA软件和硬件体系;再次介绍了CUDA线程模型;最后对CUDA存储器结构的相关知识进行了总体介绍。为凝胶图像预处理和蛋白质点检测的CUDA并行化实现做知识储备。(2)研究了基于CUDA的凝胶图像预处理快速实现方法。首先采用并行化非局部均值算法(NLM,Non-Local Means)对凝胶图像进行滤波处理;其次为校正凝胶图像背景因素的干扰,采用CUDA架构并行化实现形态学高帽变换(top-hat)方法;再次根据凝胶图像特点使用CUDA架构的线程及内存,并在此基础上高效实现NLM图像去噪算法和top-hat背景校正算法;最后在NVIDIA GTX605的GPU下,采用VS2010搭建实验平台,分别实现了CPU串行运算和GPU并行运算。实现结果表明本文方法的执行效率明显高于CPU串行运行方法。(3)提出了基于CUDA的蛋白质点检测快速实现方法。首先依据内外标记分水岭算法原理对其进行并行化设计,研究了内外标记分水岭的并行化方法;其次针对预检测结果中重叠蛋白质点未分离的情况,对各种重叠蛋白质点进行分析,根据CUDA架构并行化的特点研究形状标记分水岭算法;再次根据凝胶图像特点以及CUDA单指令多线程的执行方式对凝胶图像数据空间进行二维分块,将整个检测算法运算分成多个子运算并行进行,并利用共享寄存器和二维纹理内存等内存管理措施实现了蛋白质点快速检测方法;最后在VS2010平台下,分别讨论了CPU和GPU实现方法,实验结果表明本文方法的效率明显高于CPU串行运行方法。