论文部分内容阅读
针对行人检测过程中人的形体变化大、场景复杂、存在遮挡等特点,本文重点研究基于深度学习算法的行人检测技术。本文首先研究了基于Faster R-CNN深度学习方法的行人检测,把行人检测问题转化为提取行人候选区域再分类的问题:先利用卷积神经网络RPN提取行人的候选区域,接着用Rol池化层进行尺度归一化,最后输入到Softmax分类器和边界框回归器进行分类和行人的定位。本文通过挑选训练样本、调整网络、训练参数重新进行了端到端的检测器训练,提高了检测性能。其训练所得的Faster R-CNN行人检测器在INRIA数据库测评的平均漏检率为9%,在Caltech数据库测评中,平均漏检率低于大多数传统方法,其中相比HOG方法,分别降低了 37和49个百分点,通过实验验证了 Faster R-CNN深度算法应用于行人检测的有效性和实际应用性。接着本文首次将R-FCN深度学习方法应用于行人检测。该方法使用具有强大特征表达能力的残差网络作为基础网络,除了提取行人的候选区域,还提取针对行人相对位置敏感的特征,这使得检测器在检测过程中能够更好地适应行人的平移变换。在严重遮挡场景下,R-FCN方法的漏检率低于所有传统方法以及两个最新的深度学习方法(RPN+BF和F-DNN),其中,比HOG降低了 44个百分点,比RPN+BF降低了 22个百分点,证实了 R-FCN方法在行人存在严重遮挡情况下,具有很好的检测性能。最后本文研究了基于SSD多尺度的行人检测。本文训练所得的SSD检测模型在Faster R-CNN的基础上进一步降低了平均漏检率,并提高了检测速度。在INRIA数据库中,通过与多个传统方法以及RPN+BF和F-DNN进行多种尺度数据集下的性能评估,SSD检测模型平均漏检率为8%,比RPN+BF和F-DNN方法高1个百分点,但在检测速度上有较大提高。其结果表明,SSD行人检测器具有较好的应用价值。本文还对所训练得到的Faste R-CNN、R-FCN及SSD检测器进行综合性能分析。