论文部分内容阅读
机器视觉的研究工作很早就引起了研究人员的重视,如今相关技术已经融入了我们的日常生活。面对现实世界中的海量图像信息,机器的处理效率往往达不到需求,而人眼实际上只对图像中的某一小块区域感兴趣。因此若能用机器来模仿人眼的工作模式找出这些感兴趣区域那么就可以提高视觉处理的效率。显著性区域检测的研究工作就是找到这样一个可能的目标区域,缩小目标的寻找范围,为后续的工作奠定基础。可靠的显著性区域检测算法可以为诸如目标检测、目标追踪与识别等应用提供有价值的参考信息。为了找到合适的显著性区域检测模型,本文从度量方法、特征融合和目标先验信息的利用这三个方面对算法进行了研究。由于显著性区域检测算法是遵循视觉显著性模型的,为了对显著性区域检测的相关问题有一个更根本的认识,本文首先从神经生理学和认知心理学两个层面对与视觉显著性相关的知识与原理进行了概括和总结。这些内容包括视觉信号在视神经系统中的传导过程、视觉通路在参与视觉信号分析时所担负的作用,以及展现自底向上的视觉刺激与自顶向下的调节过程的认知心理学现象。为了度量图像区域中的显著性,本文提出了一种基于“扩散映射”的显著性区域检测算法。本方法在超像素分割的基础上提取特征并以此建立图模型,对归一化后的图模型数据运用扩散方法映射到流形空间,通过扩散距离来计算超像素之间的差异性和全局对比度信息,从而获得显著性图。实验结果证明,该流形空间上计算的显著性图很好的反应了图像区域之间的差异性,有效的突显出了显著性区域。针对显著性区域检测中的特征融合问题,本文提出了一种基于“交叉扩散”的特征融合方法。显著性区域检测的计算都是以特征为基础的,由于不同的特征下每个像素或区域的表述是不同的,所以依据不同特征得到的显著性值也会有所不同。因此如果能合理的融合这些特征,使它们在显著性表述上相互补充,就能改善最终的显著性结果。“交叉扩散”算法让不同特征下获取的相似性矩阵通过迭代计算相互融合,并以此融合结果得到状态转移矩阵作用到初始显著性上。实验表明,运用该算法进行的特征融合在绝大多数情况下都能让初始的显著性结果得到改善。自顶向下的显著性区域检测模型依赖于高层的目标先验信息,本文提出了两种将目标先验信息用于显著性计算的方法。其一,利用训练样本的标签信息,使用有监督的距离度量学习算法得到一个改善后的特征间的距离计算公式,通过全局对比度的计算得到一个增强后的显著性结果。其二,利用一般性目标检测算法得到样本中泛目标的位置候选窗口集合,通过这些候选窗口的坐标信息得到目标的位置概率分布,以此概率分布值对已有的显著性结果进行加权修正可以使之更加准确。具体表现为显著性图中的目标区域更加突出,轮廓更加清晰,且背景区域得到很好的抑制。