论文部分内容阅读
视觉注意是人类视觉感知的一个重要属性,人类可以从外界输入的大量视觉信息中迅速判断感兴趣信息,使感兴趣信息优先得到大脑神经与心理资源的处理。视觉注意模型即为采用计算的方法建立模型来模拟人类的视觉注意机制。当前通常采用分析场景视觉显著性的方法来构建视觉注意模型。视觉注意模型的研究不仅对于探索人类视觉系统的工作机制有重要意义,而且在图像处理相关领域,视觉注意模型常被采用作为一个预处理步骤,判定待处理图像的相关重点区域,抑制非相关区域,以极大节省后续计算资源,具有广泛的实际应用价值。人类视觉存在两种注意机制:自下而上和自上而下,本文的重点是自下而上的机制。目前自下而上的视觉注意模型有空间域模型和变换域模型。通常基于空间域的模型计算复杂度高,但具有更强的生物学合理性,基于变换域的模型则相反。本文首先阐述了视觉注意研究的背景及意义,分析了该领域内的研究状况,介绍了几种经典理论以及计算过程,并总结了基于显著性分析的视觉注意计算模型的关键过程。接下来,详细分析了PCT模型的本质,并提出了一种高频离散余弦变换(HFDCT)视觉注意模型,该模型获取的显著图与PCT模型非常接近,计算速度却比PCT模型快了1.6倍左右;此外,本文提出了另外一种改进的PCT计算模型:多尺度PCT模型,该模型在特征通道选择,特征尺度,以及特征显著映射图归一化等方面有所优化。另外,本文提出局部显著性与全局显著性的概念,并提出了一种分层(M-S)视觉注意计算模型,该模型能综合局部与全局显著信息,以生成图像的视觉显著图。在多显著目标的情况下,分层模型能更快速的识别出异类目标。论文的主要贡献包括以下几个方面:(1)详细分析了人类视觉注意的工作机理,对当前主流的视觉注意计算模型进行了适当的综述总结,阐述了基于显著性分析自下而上的视觉注意计算模型的一般计算框架,并分析了其中的关键步骤。这对于后续相关研究有一定的指导意义。(2)深入阐述了PCT模型的计算过程,分析了PCT模型的本质,并提出了一种更为快速的视觉注意模型:高频离散余弦变换模型。(3)提出了一种多尺度PCT模型,模型从特征通道选择,特征尺度以及特征显著映射图归一化三个方面对PCT模型提出了改进策略,本文对该模型进行了阐述,以及仿真实现。仿真结果表面,多尺度PCT模型更加符合人类的视觉注意特点。(4)提出了一种分层视觉注意计算模型的框架结构,该模型框架首先利用局部显著信息快速浮现潜在目标区域,然后采用区域特征竞争得出各区域权重,最后得到完整的显著图。该模型框架能很好地综合局部显著信息和全局显著信息,在多显著目标的情形下,能快速的标注异类目标的位置。本文提出的分层视觉注意机制并未见诸相关文章记载,具有一定的创新价值。