论文部分内容阅读
图像分割是计算机视觉领域的基础研究,在图像处理方面起着非常重要的作用。随着数码产品的更新换代,数字图像已经越来越多的出现在我们的生活中。对于图像去噪、图像缩放、图像分类和图像理解等应用,精准的图像分割作为基础研究起着至关重要的作用。随着越来越多的图像种类的出现,对图像分割算法提出了新的挑战和要求。本文研究针对复杂结构图像,受人类感知研究启发提出基于多视图特征语义的图像分割算法,结合语义哈希模型加速优化过程,获得理想的分割效果。复杂结构图像是一类具有“类内相异、类间相似”的图像。在这类图像的分割过程中,传统的分割方法会出现准确度低、过分割、欠分割、人工调参困难等问题。本文在分析复杂结构图像特点后,提出基于像素级特征语义的相似度度量函数,通过比较两两像素之间的相似度距离,得到图像的相似度矩阵,实现基于聚类思想的图像分割算法。为了解决计算开销较大,耗时过长的问题,引入语义哈希模型,加速寻优过程,通过汉明距离的计算得到最终的分割结果。基于人类感知研究成果,对于不同类型的图像,不同视图特征(显著性、景深、颜色等)的贡献度是不相同的。传统分割算法将多视图特征合并为长向量进行计算,没有考虑不同视图特征对不同图像的贡献度不同的问题。本文为解决这一问题,提出多视图特征分割算法。在图像多视图特征空间,通过最小化特征相似度距离函数,提出特征选择矩阵,寻找最优的特征投影平面,使得多视图特征投影具有最好的图像分割效果。通过与最新的无监督图像分割算法和基于深度学习的分割算法进行的对比实验,验证了本文算法的有效性和先进性。本文工作主要创新如下:(1)针对复杂结构图像提出像素级相似度度量函数,将图像分割模型重新表示为像素对的相似度最小化问题。在优化过程中,通过引入语义哈希模型,加速寻优过程。(2)受人类感知研究的启发,提出多视图特征语义图像分割算法。针对图像的多维度特征,在解空间内寻找最优投影平面,从而获得对于图像分割敏感的多视图特征投影矩阵。本文的主要工作包括:(1)对当前图像分割算法、语义哈希算法进行文献综述,分析和发现存在的问题。(2)针对两种类型的复杂结构图像,提出像素级语义相似度度量函数,结合语义哈希模型提出分割算法并实现。通过对比实验,从仿真时间和评价指标方面验证了本文方法的有效性。(3)我们提取空间、颜色、显著性和深度等多视图特征后,将特征通过潜在的问题解平面进行投影得到低维特征,提出多视图特征语义图像分割算法并实现。通过在BSD500,Pascal VOC 2012等数据库与最新无监督分割算法、深度学习算法进行定性和定量对比实验,验证了本文方法的优异性。