论文部分内容阅读
语义分割是当前计算机视觉技术领域一个活跃的应用技术与研究领域,任务主要是分配图像中每个像素的标签。借助语义分割算法对道路图像中的场景进行检测,可以有效帮助自动驾驶系统对其环境进行理解并分析,为无人驾驶系统的应用提供先决条件。因此本文着重对道路场景的检测进行研究,主要贡献在于以下两个方面:针对现有的道路语义分割模型空间信息不够丰富,感受野不够大等网络结构方面的问题,本文研究基于深度学习的道路图像语义分割算法,通过对语义分割研究现状进行深入地分析,提出了双重金字塔分割模型DPNet。具体来说,详细介绍了编码器和解码器的设计及改动,以此为基础构建出DPNet。论文通过对比实验验证设计的有效性并汇报了DPNet在Cityscapes数据集、CamVid数据集和安防监控数据集上的表现。针对复杂道路场景下行人、行车对道路边界线的遮挡造成的传统算法难以检测、道路欠分割难题,从场景构造的层面切入,分析道路成像特点,提出了一种改进的实例分割道路检测方法。首先使用实例分割对道路区域进行提取,然后通过凸包算法补偿行人、行车对道路边界线的遮挡,最后将其拟合成符合场景结构的梯形模型,从而实现通过单目图像去还原完整的道路区域,优化对复杂场景下道路的检测。综上,本文针对复杂场景下的道路检测任务,提供了两种思路:一种是从网络架构层面切入,对现有道路语义分割模型进行改进,提高道路检测精确度;另一种从场景结构层面切入,提出符合复杂道路场景的梯形模型,优化对复杂道路的检测。本文方法在三个真实场景的道路数据集上进行了实验测试,并与多种现有的前沿道路检测算法进行了对比。实验测试结果表明,本文检测算法在多种复杂情况下,具有相对较高的鲁棒性和准确性,相较于现有检测算法的实验结果更加可靠,具有实际意义。