论文部分内容阅读
图像分割是图像分析、模式识别和计算机视觉等领域中一项基础而关键的工作。由于自然图像内容的复杂性,完全自动的分割方法往往通用性较差,准确性也较差,相比之下引入智能优化手段的交互式半自动分割通过有限的用户交互,获取尽可能多的分割信息,快速,准确的分割出目标对象,具有更强的实用性。图割是一种优秀的智能优化算法,近年来受到了人们的广泛关注。基于图割理论的交互式分割模型由于其很好的将图像区域特征与边界特征结合起来,并具有多特征融合、全局最优、算法效率高等优良特性获得了广泛应用,在图像分割领域中成为了一个新的研究热点。本文对基于图割的交互式图像分割模型进行了优化,主要从提高算法效率、多特征融合、shrinking bias问题的解决三个方面进行了研究。本学位论文主要包括以下几个方面的研究内容:(1)提出了基于图割的小波多尺度迭代分割模型。GrabCut算法是一种有效的交互式图像分割算法,但其基于整幅图像迭代分割来估计高斯混合模型(Gaussian Mixture Model,GMM)参数的做法,严重制约了算法的效率。针对这一问题,本文提出了基于图割的小波多尺度迭代分割模型,利用小波变换多分辨率分析的特点,对GrabCut算法模型进行优化。通过对图像进行小波变换,将变换中的低频子带图像作为估计GMM参数的训练样本进行多尺度迭代分割,将粗尺度的易分割性与细尺度的精确性有效结合起来,在保证准确性的前提下,有效减少了样本数目,提高了算法效率。另外,针对图割算法固有的shrinking bias问题,本文利用高频系数进行多尺度边缘检测,用于计算局部自适应的正则化参数,改善了对细长边界的分割效果。(2)提出了基于图割的JPEG图像快速分割模型。针对图割算法对高分辨率图像分割的实时性能不佳的问题,本文面向被广泛应用于互联网和数码相机的JPEG图像,提出了基于图割的JPEG图像快速分割模型。利用JPEG图像的特殊编码格式,提取图像编码中的直流系数(Direct Current, DC)生成DC低频图像,降低GMM参数学习的训练样本数;结合直流系数与交流系数(Alternating Current, AC)生成纹理特征,通过计算颜色与纹理特征分布之间的KL距离,将两种特征有机结合起来;利用AC系数的高频特性,计算像素的边缘概率,构造局部自适应正则化参数。该模型由于直接利用图像的JPEG编码数据而不需要额外的其他变换,从而提高了对高分辨率JPEG图像的分割效率,改善了对纹理图像和细长型边界的分割能力。(3)提出了结合视觉显著性与图割的图像分割算法。针对当前景和背景的颜色重叠时,容易产生分割错误及shrinking bias现象,以及利用边缘概率构造局部自适应正则化参数存在边界难以确定,增加了额外的计算等问题,本文提出了结合视觉显著性约束的图割算法,结合图像内容的视觉显著性分析,在能量函数中加入显著性约束项,提高数据项约束的可靠性;通过构造均值显著图平抑噪声,并进一步对小面积区域进行降噪处理,提高显著性约束的准确性;通过对颜色重叠现象的估计,自适应调整颜色约束项与显著性约束项的作用比例;直接利用像素属于前景/背景的概率构造局部自适应的正则化参数,提高了算法的效率。本文方法有效改善了分割效果及shrinking bias现象。(4)提出了结合CS_LBP纹理特征与图割的快速分割算法。针对基于像素计算导致的交互效率不高,以及当前景和背景的颜色很相似时,数据项的值将也很接近,能量函数的值将主要取决于光滑项,此时用户通过交互引入的先验信息将作用有限,从而导致错误的分割,而且当光滑项起主导作用时,由于能量函数的最小化,对细长边界的分割将产生影响,容易导致shrinking bias现象,因此必须考虑重要的纹理特征,而常见的利用共生矩阵、Gabor滤波器提取纹理特征,又存在计算量大,复杂度高的问题,本文提出了结合CS_LBP纹理特征的快速图割算法,利用Mean Shift算法对图像进行预分割,形成超像素,构建区域邻接图,有效减小s-t网络流图的规模,提高了算法的效率;利用累计直方图、简单有效的CS LBP纹理描述子对每个区域进行颜色和纹理特征的提取,在能量函数中引入纹理约束项,并结合局部自适应的正则化参数,从而提高了算法的效率,改善了对纹理图像和细长边界的分割效果。