论文部分内容阅读
图像标注通过对图像底层特征进行语义建模,用生成的语义模型来标注图像内容,以便准确和全面的反映图像内容。它能帮助计算机更好地分析和理解数字图像,在医学图像的标注、数字图书馆的建立、机器人视觉场景理解、数码相片的检索和管理等方面具有广泛的应用前景。本文以图像分割为基础,对超像素区域进行特征提取、建立基于超像素区域的词包建模、对多尺度空间的局部约束稀疏编码进行研究,改善图像分割效果,并提高标注结果准确性,具体研究工作如下:(1)针对超像素分割算法的分割结果较琐碎的过分割问题,提出基于相似性和统计一致性检验的超像素的图像分割算法,改善基于超像素图像分割的过分割问题。该方法将超像素分割结果作为区域合并的基本单元,利用基本单元的颜色相似性、空间距离大小和统计特性一致性对超像素区域进行合并,解决过分割问题。仿真实验结果表明,该方法能有效的改善超像素过分割问题,并且用于评价分割算法的概率Rand指数和信息变化指数都有所提高。(2)针对词包模型与SVM分类一幅图对应一个标签的单标签分类问题,提出一种基于超像素词包模型与SVM分类的图像标注算法。该方法将超像素分割结果作为区域分类的基本单元,并利用图像库生成的词包模型与SVM分类器对超像素区域各个区域分别进行分类,通过统计超像素区域分类结果对图像进行多个标签的标注。仿真结果表明,该方法能有效的改善基于词包模型与SVM分类的单标签分类问题,并且提高分类的准确性。(3)针对空间金字塔的固定网格划分和向量量化编码忽略码本基向量的空间位置问题,提出基于局部约束稀疏编码多尺度空间的图像标注算法。通过超像素分割和基于相似性和统计性的区域合并准则,对图像进行多尺度划分,保留图像的中目标区域,充分利用图像的空间上下文信息。为了改善编码性能,利用码本中具有相似性的基向量的加权表示图像特征,对图像特征进行位置约束和稀疏表达。仿真结果表明,该算法不仅可以利用图像的多尺度信息,而且还能改善编码性能,提高标注结果的准确性。