论文部分内容阅读
在计算机视觉领域,显著性检测指对人的视觉选择注意机制进行建模。其输出结果通常被称为显著性图,该图表征了图像场景中不同区域的显著程度。由于显著性检测可作为从图像中获取兴趣区域的有效手段,其被广泛应用于目标检测与识别、图像压缩、视频汇总、基于内容的图像编辑、图像检索等。本论文致力于视觉显著性检测领域的一个分支研究方向——显著区域检测,其目标旨在从输入自然图像中检测并分割整个显著的物体。在近十年里,该研究引起了广泛关注并获得了迅猛发展。尽管现存有许多针对显著区域的检测模型与算法,从复杂且非限定的场景中检测显著物体仍然极具挑战。本文提出五种创新的显著区域检测方法,每种方法受到不同研究动机的驱动以解决现有方法中所存在的缺陷与不足。本文的主要内容与创新点总结如下:1.提出一种利用图像颜色特性包括颜色对比与颜色分布的显著性检测方法。所提出方法将颜色对比与颜色分布的计算归纳至同一基于超像素的计算框架之下,并结合颜色分布的中心先验,分别计算基于超像素的颜色对比显著性图与颜色分布显著性图。因此使得这两类特征能互补不足,提升检测准确度。2.提出一种基于测地线距离的显著性传播方法,依据测地线距离来保持检测结果中物体显著性值的一致性。给定一幅基于超像素的粗糙显著性图,某个超像素的初始显著性值被传播至图像中所有的超像素,其传播强度受到测地线距离的控制。本文将所提出的传播方法称为测地线传播,其与测地线滤波有着紧密联系。测地线传播一定程度上能修正并优化显著区域检测的结果,恢复被错误抑制掉的物体部分同时抑制一些被误检的背景噪声,最终得到增强后的显著区域检测结果。3.提出一种基于归一化图分割(Normalized cut,简称Ncut)的显著性检测方法。该方法利用Ncut所得的特征向量来诱导显著性图的生成。由于Ncut能产生比过分割更好的聚类结果,被诱导生成的显著性图能更加准确地检测出显著物体。该方法不同于现有检测方法,因为后者通常采用忽略物体整体性的过分割区域或图像块来计算显著性。所提出方法将超像素视为图模型的结点,并建立一个考虑图像中颜色与边缘特征的图模型从而实施Ncut。本文提出一种自适应区域融合技术来发掘Ncut特征向量中蕴含的聚类信息,同时将区域显著性计算嵌入到区域融合过程中得到不同的中间显著性图;在将不同层次的中间显著性图进行集成后得到了与现有方法可比甚至更优的检测结果。4.提出一种鲁棒的显著性传播技术,称之为流形保持传播(manifoldpreserving diffusion,简称MPD)。MPD同时利用了流形上常用的两种假设:流形局部光滑性与流形局部线性重构。流形光滑性假设反映了条件随机场特性而相关的惩罚项促使相似的图结点有相同的显著性值。而与流形局部重构假设相关的惩罚项促使从特征空间到显著性值的变换为同一线性映射。在所提出方法中,基于此两种假设的图边权值被自适应地通过最小化特征空间重构误差而确定。相比手工设置参数的相似性函数,该方法能更好地适应不同的输入图像。将MPD用于显著性传播,本文进一步给出一种新的两阶段显著性检测方法,称之为流形保持传播显著性(manifold-preserving diffusion-based saliency,简记为MPDS)。MPDS联合图像边界先验、哈里斯角点凸包、人眼注视点凸包来求取用以传播的初始向量与粗糙显著性图。5.将完整的连续条件随机场(continuous conditional random field,简称C-CRF)的学习及其推断理论应用于显著区域检测。通过C-CRF学习,能够以数据驱动的方式自主地寻求最优的数据项显著性特征与逐对特征结合方式。这不同于现有相关检测方法通常只采用手工设计的CRF特征参数,或者仅采用一些学习策略对其数据项的相关特征参数进行学习。另外本文还提出一种新的逐对特征计算方法,其基于图模型拓扑结构分解,使C-CRF能够对不同空间范围的逐对特征参数进行学习。