论文部分内容阅读
图像分割指的是根据灰度、颜色、纹理以及几何形状等特征信息把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。图像分割技术是图像处理领域中的重点研究内容,也是模式识别和语义分割的基础,它在智能移动机器人中的物体抓取以及运动避障方面有着广泛的运用。由于自然图像中场景的复杂性,加之人的视觉感知上的主观性:人们对图像场景理解不尽相同,因此,图像分割一直是计算机视觉中的一个难点。随着近几年三维相机的普及,获取RGB-D数据越来越容易,使得基于RGB-D数据的室内场景分割得到越来越多的关注。针对以Kinect点云形式表征的RGB-D数据分割还有很多技术难题需要突破,如:三维点云数据量大,分割过程耗时较长,此外,由于三维室内场景本身的复杂性,因此分割结果中容易产生瑕疵。本文针对RGB-D数据的室内场景分割中存在的上述问题,研究了基于超体素融合分割及后续的优化算法,主要工作可分为以下几个方面:首先,对点云图像进行超体素预分割。通过设置体素尺寸,将点云转化为体素云,基于体素,提取体素的颜色,空间坐标,法向量等特征信息,对特征相似的体素聚类,得到超体素分割结果。由于超体素是特征相似且空间相邻的点云的聚类,因此使得后续的点云分割不在是基于单个点云作为处理单元,降低了后续处理的复杂度。其次,对超体素进行聚类融合。本文利用扩展凹凸性判定准则,判定相邻超体素之间的边界的凹凸性,基于相邻超体素之间连接边的凹凸性,对凸连接的相邻超体素融合,从而实现对超体素聚类。最后,针对超体素聚类分割结果中存在的一些不足,提出优化方案,采用图论算法,构造由数据损失、平滑度损失以及标签损失三项组成的能量函数,通过求取能量函数的最小值优化分割结果,得到最后精细的分割结果。通过实验结果对比表明,本文的分割方法较于其他算法,分割准确性方面有一定的提升,同时时间消耗较小。除此之外,本文算法属于非监督分割算法,相较于监督分割算法,无需进行人工手动标记以及样本训练。