论文部分内容阅读
合成孔径雷达(Synthetic Aperture Radar,SAR)图像是遥感图像的一种。SAR图像变化检测作为SAR图像主要应用之一,已经广泛应用于如农业调查,森林监测和灾害评估等方面。近年来随着遥感技术的发展和SAR成像能力的提升,SAR图像呈现出海量的特点,同时SAR图像的尺寸越来越大。传统的SAR图像变化检测方法难以处理海量和大尺寸的SAR图像。Hadoop是一个分布式并行计算框架,它通过组件YARN和HDFS整合了集群中多个节点的计算能力和存储能力来处理大数据。本文提出基于Hadoop的分布式无监督SAR图像变化检测方法,应对传统方法处理海量和大尺寸的SAR图像面临计算和存储能力有限的挑战。1.本文提出两种基于Hadoop的模糊局部信息C-均值(Fuzzy Local Information C-Means,FLICM)算法,首先针对海量SAR图像的变化检测提出了Map-FLICM聚类算法进行差异图分析。在Map-FLICM聚类算法中,只用了MapReduce的Map,在Map函数中利用FLICM聚类算法对差异图进行分析。实验表明该方法相对串行方法最高获得了31.45倍的加速。其次针对大尺寸SAR图像的变化检测提出了MapReduceFLICM聚类算法进行差异图分析。在MapReduce-FLICM聚类算法中,在Map阶段进行隶属度的更新计算,在Reduce阶段更新聚类中心。由多个MapReduce任务实现了FLICM算法的迭代过程。利用MapReduce-FLICM聚类算法进行差异图分析时,将SAR图像按照网格进行划分并在分割线处增加重叠区以保证分割线处的邻域信息不丢失。实验表明该方法能有效的进行大尺寸的SAR图像变化检测。2.本文提出一种Hadoop与开放计算语言(Open Computing Language,OpenCL)结合的框架,利用OpenCL将计算密集型任务转移到协处理器上完成,以提高基于Hadoop的无监督SAR变化检测中分析差异图的效率。将核模糊C-均值(Kernel Fuzzy C-Means,KFCM)聚类算法在Hadoop与OpenCL结合的框架下分别以MapReduceKFCM和Map-KFCM的方式实现,利用协处理器加速MapReduce-KFCM和MapKFCM。MapReduce-KFCM算法需要迭代式MapReduce任务作业来完成。在MapReduce-KFCM中,通过增加MapReduce内的迭代次数,以减少MapReduce的任务数从而提高MapReduce-KFCM算法的效率。最后对基于MapReduce-KFCM和MapKFCM聚类算法的SAR图像变化检测方法的进行正确性和性能实验。实验表明相比于在普通Hadoop上实现差异图分析最高加速了3.56倍。