论文部分内容阅读
图像理解的研究内容主要包括两个方面:一是场景中的目标检测;二是场景描述与识别。在现实世界中,目标的出现都存在一定规律,与其周围场景有着密切的联系。因此场景描述与理解可以为目标识别提供先验知识,提高对象检测算法的性能。目前对场景描述与理解的研究主要分为两个方向:一是从视觉心理学和生理学的研究出发,主要研究快速场景感知的心理和生理(如显著性区域检测);二是研究场景分类的统计分析模型,通过建立简单的统计计算模型实现场景的判断(如室内室外场景分类)。传统的视觉显著性算法依据人的视觉模型只能获得图像的显著性点,限制了其进一步的应用,因此如何从一张图像中获取图像的显著性对象区域成为显著性区域检测的新的目标。另外由于光照条件,尺度变化等因素的影响,造成场景分类描述的复杂性,因此如何抽取具有鲁棒性的特征用来场景理解成为图像理解的热门研究课题。本文在系统的论述了国内外图像显著性对象方法以及场景分类算法的现状和难点的基础上,分别提出了两种新的显著性区域检测方法以及一种新的中层特征用于室内\室外场景分类算法。本文的主要工作和创新点包括:1.图像显著性区域检测过程中,由于大多数算法采用基于强度、边缘以及颜色的局部Center-Surround Differences策略,生成的显著度图像通常只高亮显著性区域边缘信息而不是完整的显著性区域。针对这一个问题,本文通过纹理的对比来区分显著性区域和背景区域。通过猜想图像的显著性区域和背景区域有不同的震荡幅度,我们提出了一个新的显著性区域检测算法。利用图像极值插值,更好的保持了图像的边缘信息,同时获得了图像不同区域的震荡幅度,通过计算震荡幅度的不同获得图像的显著性区域。实验证明,我们的方法生成的显著度图能够均匀地高亮了整个显著性区域。2.基于频率的显著度图检测算法使用图像的平均值作为图像的冗余信息。对于多数图像,使用均值会降低显著性区域和背景区域的对比,从而增加区分显著性区域和背景区域的难度。本文把背景信息当作图像冗余信息,通过图像颜色插值移除背景信息,生成的显著度图能够均匀的高亮显著性区域,显著性区域和背景区域具有高对比度,并且在公共数据库上有很高的准确率和召回率。3.传统的图像场景分类算法只使用图像的低级特征,如颜色,边缘,纹理等,无法引入图像的空间信息和图像的语义信息。本文通过采用超像素作为处理单元,自然的引入图像的空间信息。另外,图像的超像素通常都是含有语义的对象或者是对象的一部分,从而引入图像的语义信息,成为图像分类的理想处理单元。实验也表明,采用中级特征可以有效的把图像分为室内和室外场景。