论文部分内容阅读
在计算机视觉,三维语义分割作为三维场景理解的一个重要基础,被广泛应用到多个三维感知领域,例如:无人驾驶中激光雷达车辆分割、增强现实中物体形状分割和机器人避障中场景分割等。随着深度学习在视觉领域的广泛应用,直接在三维点云上进行深度学习受到更多关注。PointNet是基于点云学习的先进方法,但是PointNet模型在点云的学习上,没有很有力地利用点云之间的局部信息,导致语义分割结果比较模糊,精度不高。针对于以上限制,本文以提高点云的分割精度为目标,基于PointNet模型,提出了一种基于KNN搜索算法的点云语义分割算法;随后在该算法基础上,以提高深度学习效率为目标,提出一种基于超体素特征学习的三维点云语义分割方法。本文具体工作如下:(1)提出基于KNN搜索的三维点云语义分割方法,改进了PointNet模型在局部点云特征提取上的不足,能够有效地提高语义分割的准确度。该算法主要分为三个部分:第一,基于PointNet模型实现点特征提取子模块,用来提取原始点云更加强有力的高维度特征;第二,在高维度的特征空间中建立局部特征提取子模块,该子模块使用KNN算法搜索每个查询点的K邻域,提取出局部特征;第三,联结点云的全局特征和局部特征对点云进行语义分割。实验表明,提取点云之间的局部特征,有利于提高语义分割的精度。与PointNet模型相比,该算法总体准确度oAcc提高5.8%,平均交并比mIoU提高7.1%。(2)基于数据稀疏的思想,提出了基于超体素特征学习的快速三维点云语义分割方法,在保证分割精度的情况下加快深度学习训练和测试的过程。主要分为三个步骤:首先,将高密度点云利用超体素分割生成稀疏点云,并且计算法线、FPFH特征作为稀疏点云的学习特征;其次,基于稀疏数据训练语义分割网络,加快网络的训练过程;最后,使用全连接条件随机场进行后端处理,精细化处理语义分割网络的粗糙分割结果。与PointNet相比,本算法总体时效率加快3.6倍,其中训练时间加快5倍,测试时间加快2倍,并且在分割精度上,总体准确度oAcc提高0.8%,平均交并比mIoU提高2.7%。针对于上述基于KNN搜索的语义分割方法和基于超体素的快速三维语义分割方法,本文基于S3DIS数据集对两个模型进行了详细测试和分析,并且与PointNet模型进行了多方面的对比。实验结果表明,本文的两种算法在分割精度上都超过了PointNet模型,验证了算法的可行性和有效性。