论文部分内容阅读
目前智能交通的发展已上升为国家战略,成为推动国家战略转型的重要推手。目标检测技术作为交通智能化的基础支撑技术,其实现了对感知目标的精确分类和定位,检测性能的好坏直接影响后续的融合决策控制环节,是大量智能高级任务的必备前提。目标检测技术在智能交通领域具有重要的研究意义和应用价值。二维目标检测技术无法适应当前复杂的道路环境,针对三维目标检测技术,仅仅依靠单一摄像头很难获取准确三维信息,双目或三目视觉技术的准确性仍然不高,且摄像头性能受环境影响较大。相比技术上的创新,激光雷达能够获取目标准确三维信息、稳定性高等优势弥补了摄像头的不足,同时图像数据具有丰富的颜色信息以及稠密的像素点等优势。因此本文面向智能驾驶环境,利用多传感器间的互补特性以及神经网络强大的特征提取性能,提出基于激光雷达与摄像头的三维目标检测技术。从深度特征信息表达和多源数据融合两方面对三维目标检测算法进行如下改进:(1)针对深度特征信息表达的特征提取阶段,提出拓扑结构优化的残差网络,并利用卷积核变换实现网络轻量化。在复杂度不变、输出维度不变的原则下,通过对比实验确定最佳拓扑结构优化模型,目标检测准确率较传统算法提升了4.6%。卷积核变换针对残差结构中尺寸为3?3卷积核,提出先滤波再优化的分通道卷积思想,经复杂度对比计算,模型复杂度下降30%,检测速度达到53 FPS。(2)针对深度特征信息表达的区域提名阶段,提出集成多阈值的区域提名网络。通过实验分析交并比参数设置对网络回归性能的影响,发现单一阈值无法满足对所有锚框的最优回归问题,仅当输入值在阈值附近时回归效果最佳。因此借鉴机器学习中集成学习思想,考虑算法复杂度的限制,设计集成两个阈值的区域提名网络,使得目标检测准确性再次提升2%左右。(3)在多源信息融合方面,基于图像和点云数据,提出多源数据深度融合网络。结合深度融合算法优化三维目标检测算法得到目标的方向和深度等信息,实现对目标的三维描述。所有优化阶段均基于KITTI开源数据集进行实验验证,所提出的三维目标检测算法获得了优化过程中的最低检测错误率。