论文部分内容阅读
注意选择机制是人类视觉感知的一个重要特性,如果将人类视觉系统的这一机制引入到计算机视觉系统中,势必会提升现有计算机图像分析性能和效率。为了探索人类视觉注意机制的计算模型构建方式及其应用,本文的具体研究工作如下所示:首先,本文回顾了自底向上的视觉注意模型、自顶向下的视觉注意模型和视点转移机制的研究现状,还介绍了视觉注意模型在图像分割、图像分类和目标检测方面的应用。通过对人类注意机制的深入研究,本文分析得到了模拟视觉注意时的三个关键因素:图像局部区域之间的不相似度、图像局部区域之间的空间距离、图像局部区域到图像中央的距离即中央偏好特性。其次,本文提出了一种联合空域和特征域信息的视觉注意模型,该模型建立在上述三个关键因素基础上,核心步骤是用图像局部区域之间的空间距离和中央偏好特性对局部区域之间的不相似度进行调制,其实质是把图像每个区域的人眼关注程度定义为基于空间距离加权的全局特征响应稀有性。本文在多个图像库和视频片段上采用不同的测试标准进行了测试,结果显示与部分国际知名注意模型相比,该模型预测的视点与人类真实视点更一致。最后,本文将该模型应用于基于内容的图像缩放。由于图像的主题一般反映的是人物、自然景观、城市景观等高级语义信息,而上述模型缺乏对这类信息的检测能力,因此本文在该模型基础上添加了人脸、行人和车辆检测器。测试结果表明与传统图像缩放方法相比,基于该模型的方法能够保证图像中的前景物体扭曲程度更小。