论文部分内容阅读
行人、车辆和动物等非轨旁固有物进入铁路警戒范围内会引发严重的交通事故,因此有效地检测识别进入铁路限界的异物对于保障铁路行车安全以及行人生命安全有着重要的意义。传统的目标检测算法通常使用基于滑动窗口的区域选择策略,针对性不强,预测位置不准确,冗余窗口多,计算量大及时间复杂度高。采用手工设计特征进行特征提取,无法适应待检测目标形态、检测场景及光照等变化的多样性,且鲁棒性较差。传统分类器无法处理高维图像数据且需要单独对其进行训练,训练步骤繁杂,不能满足现场实际需要。基于深度学习的目标检测算法比传统的目标检测算法具有更快的检测速度,摆脱了刻板的人工设计特征,让机器“自己学习”图像数据中蕴含的潜在特征联系,实现了对目标的精确检测分类。本文提出一种以VGG-16为特征提取网络的Faster R-CNN模型进行铁路侵限异物检测,并且对其进行了适应性改进以满足现实应用需要。本文主要做了以下几项研究工作:(1)弃用全连接层,使用全局平均池化层来完成特征整合工作。自卷积神经网络理论出现后,在卷积层后加若干全连接层似乎成为了模型标配,然而随着研究的深入,其参数量过多、计算量庞大及不能有效利用像素间的空间位置信息等缺点逐渐凸显。全局平均池化层能够有效减少模型参数的同时保证模型的性能,因此将其作为模型的全连接层的替代来进行最终的特征信息处理。分别对使用全局平均池化层和全连接层的模型进行训练测试和结果分析,发现使用全局平均池化层的应用效果更好。(2)增加区域建议网络中的锚点数量。原Faster R-CNN模型中采用的是3种规格及3种纵横比的锚点参数设定,可产生9种候选框,考虑到铁路侵限异物在视频监控中较小的特点,因此增加锚点的小参数设定,将其规格数量增加到4种,由于纵横比不同对模型影响较小,因此保留3种纵横比的设定,改进后每个滑动位置可产生12种候选框。通过不同锚点数量下模型对不同规格目标的召回率说明了改进后算法对小目标检测效果的提升。(3)使用基于迁移学习的模型训练方法。铁路异物侵限领域没有专门的可用数据集,然而数据集对于模型训练又至关重要,因此引入基于实例的迁移学习方法,使用公开数据集中与本研究领域特征空间相似的图像数据对现有异物侵限数据集进行补充。从“零”开始训练一个全新的模型的代价十分高昂且训练结果的好坏受诸多因素影响,本文提出引入基于参数的迁移学习方法,基于ImageNet对于模型参数初始化,使用人工标记的铁路异物侵限领域数据集对模型参数进行调优,并且采用交替训练的方式完成对改进后模型的训练。通过比较使用迁移学习算法前后模型的准确率说明了本文提出的训练方法的有效性。为了验证改进后的模型的整体性能,将本文模型与原模型以及其它相关深度学习模型相比较,本文算法能够在保持一定的检测精度的基础上具有较快的检测速度,对铁路侵限异物的检测精度达到了97.81%,比现有的同领域算法更具有现场实用价值。