论文部分内容阅读
图像与视频目标的精确分割问题,是计算机视觉的一个重要研究方向,也是诸如视觉检测、跟踪、识别等众多基于图像和视频分析的视觉应用的重要基础,能为各种应用提供低层的数据特征,因此对该问题的研究具有重要的意义和实用价值。基于统计方法的图像与视频目标分割中采用的先验假设为:目标的相似性和不一致性。相似性主要表现为目标区域内像素特征的相似性,而不一致性主要表现为目标区域与背景的不一致性。相应地,图像目标分割可以利用的信息主要包括:颜色,纹理,对比度等;视频目标分割可利用的信息还包括运动信息以及立体信息等。近年来,大量研究表明,利用统计方法建立目标和背景模型,并依据最大后验准则进行判决,是解决图像与视频中目标精确分割问题的一条有效途径。基于统计方法的图像与视频目标精确分割所面临的难点主要在于:(1)包括多模态的目标和背景模型,以及各类先验假设在内的有效描述;(2)众多分割信息的有效融合与处理。MAP-MRF方法为图像与视频目标精确分割问题提供了完备的数学描述,使得充分利用各类信息来提高目标分割的精确度更为有据可循,基于图模型的能量最小化方法则为此提供良好的求解基础。本文在回顾与分析众多目标分割方法的基础上,将目标分割问题描述为相应的能量函数最小化问题,基于能量最小化图割提出了一系列新的图像与视频目标精确分割方法。具体来讲,本文工作的主要创新如下:(1)深入分析了基于马尔可夫随机场和最大后验的方法,以及基于图割的能量最小化方法,并探讨了基于图形处理器硬件加速的图割算法实现。(2)针对红外图像的特点,提出了一种由粗到细的两级红外目标精确自动提取算法。该方法首先基于加权信息熵检测约束目标区域;其次,将目标精确分割描述为能量最小化函数,基于图割方法获取精确分割的目标区域;最后将该方法应用至基于图像分析的金属材料硬度检测中。(3)提出了一种基于分层图割的交互式彩色图像目标精确分割算法,由高层目标整体区域分割以及低层目标边缘精细分割两部分组成,用户能够在不同尺度和层次上进行交互操作,算法能同时满足分割精度和效率上的要求。最后,将该方法成功应用于中医舌诊客观化系统中。(4)根据城市户外环境中近红外视频的成像属性,提出了相应前景和背景模型,能有效克服信噪比低、极性变化大、目标周围存在大量光晕等挑战。(5)对于复杂动态可见光视频中运动目标与背景颜色分布重叠的问题,提出了一种综合目标时间持续性和空间一致性约束的自适应前景模型。(6)提出了一个基于条件随机场的视频目标分割模型,该模型有机地融合了时域和空域的目标观测层面及标记层面的局部约束,最后,通过对多个动态场景的实验验证了算法的有效性和稳健性。本文最后对全文进行了总结,并对未来的工作进行了展望。