论文部分内容阅读
行人检测技术属于计算机视觉的研究范畴,旨在通过算法准确识别并定位图像中的行人。无人驾驶汽车、智能机器人和监控安防等不胜枚举的场景应用中都离不开行人检测技术的支撑。随着深度学习的不断发展,行人检测技术也进入了快速发展的阶段,完成了由借助传统方式向依靠深度学习方式的转变。但需要看到的是,在行人检测领域依然存在很多十分具有挑战性的难题没有彻底得到解决。在种种问题当中,对小尺度行人的检测和对遮挡行人的检测是两个比较突出的难题,图像中的小尺度行人往往分辨率较低,限制了行人检测网络有效提取其特征信息,而遮挡的情况会造成行人特征信息的缺失,再加上行人特征本身具有非刚性形变的特点,很容易导致漏检。为了解决行人检测中这些比较突出的问题,本文主要做了如下的工作:(1)为了解决SSD(Single Shot Multi Box Detector)算法的浅层网络不能充分提取小尺度行人的特征信息的问题,提出一种基于SSD-ResNe Xt50网络的行人检测算法,在探讨了以Res Ne Xt50作为SSD基础网络有效性的基础上,用Res Ne Xt50替换SSD的基础网络VGG16,同时,通过加入融合模块和预测模块等方式,综合提高算法的检测性能。最后在Caltech行人数据集上进行实验,在与其他同类算法的对比中,表明本文算法在小尺度行人检测中更具优越性。(2)针对遮挡行人检测中的难点,基于Repulsion Loss损失函数对于处理行人遮挡问题的良好表现,提出了一种融合Repulsion Loss损失函数与先验框建议策略的行人检测算法。根据行人的细节特征,通过改进先验框的选取方式并针对性地设定重叠阈值,提升了预测框定位的准确性和网络的学习效率,实验表明,这些改进能够明显提升行人检测算法的精度。