论文部分内容阅读
近几年,随着国家城市化的迅速发展,大量的土地得到了开发,施工现象屡见不鲜,像吊车、挖掘机等大型工程车也是随处可见。工程车这一类特殊车型的车辆破坏性很强,稍不注意就会对周围的人或物造成不可挽回的损伤,带来巨大的经济损失。利用智能视频图像监控技术对车辆的状况进行检测和识别,可以及时、高效地阻止危险的发生,其中关键技术是车辆检测。应用车辆检测技术对工程车进行检测,实现对施工场景中停放或作业的工程车的监控需求,准确预警,降低了成本和预防了危险,对工人的人身安全提供保障。本论文着重研究基于深度学习的工程车检测与识别技术,主要解决两类关键问题:一是在复杂背景中工程车目标因拍摄角度和高度的不同导致的尺度多变问题,二是工程车部件灵活,造成自身外观形变较大的问题。因此,下面是本论文的主要工作:(1)将从多种施工场景中采集在不同角度下拍摄的不同型号、不同形态的工程车辆图像构成样本集,主要车型有吊车和挖掘机,然后参照标准数据集格式创建工程车数据集。而且为了防止在少量有效样本的条件下训练地模型出现过拟合现象,通过数据增强技术进行扩充,增加数据集的多样性,提升模型的泛化能力。(2)针对图像中工程车尺度多变而大小固定的候选框无法完全适应目标的问题,提出一种基于自适应搜索的工程车检测与车型识别算法,通过利用邻接和缩放网络自适应生成候选建议区域,能更好地处理一张图像中出现不同尺度的目标,并在检测器中添加在线难例挖掘算法,解决样本类别不均匀的情况,提高模型的泛化性,增加训练的有效性,在工程车数据集上平均精度均值为91.6%。(3)提出一种基于全局和局部卷积特征融合的工程车检测与车型识别算法,可以同时解决工程车目标检测、识别时出现的尺度不一、形变复杂等问题。算法通过建立多尺度感兴趣区域池化层获得图像整体结构和上下文信息,提取出目标的全局特征,并利用位置敏感感兴趣区域池化层提取出目标局部特征,在全连接层处对全局和局部特征进行加权融合,最后通过多任务学习联合预测出车辆位置和类别,在工程车数据集上平均精度均值可达92.5%,验证了全局和局部特征具有较好的互补性。