论文部分内容阅读
随着智能时代的到来,智能机器人、无人驾驶系统、智能安防技术日渐成熟并融入到生活中。人脸检测作为身份识别的关键技术,是这些领域的理论基础和技术支撑。人脸检测的目标为漏检少、定位准。但在实际使用环境中,存在人脸所占像素较小不易被检测出,以及受光照、遮挡、姿态的影响导致召回率较低等问题。传统的人脸检测技术难以有效地解决上述问题,而基于深度学习的人脸检测模型需解决检测效率与检测精确度的平衡问题。针对上述问题,本文将检测问题转化为回归问题,输入图片只需经过一次网络模型的计算,便可得到检测结果,因此提出名为YOMO(You Only Move Once)的人脸检测模型,以实现实时人脸检测。并针对小尺度人脸检测以及光照、遮挡、姿态等问题,在模型结构、数据增广、训练和测试策略等方面提高YOMO的检测精确度。本论文所做工作总结如下:(1)在保证检测精确度的同时,采用深度可分离卷积(Depthwise Separate Convolution)构造YOMO网络,通过减少网络参数来提高模型的检测效率。最终YOMO模型体积为20MB,检测640×480分辨率的图片时的速率为50.6FPS;(2)利用特征金字塔挖掘高分辨率特征图中含有的小尺度人脸信息,引入特征融合的方法,结合底层的细粒度信息与顶层的语义信息,以提高模型对小尺度人脸的检测精确度。为提高模型的多尺度检测能力,增加检测结构的数量,并且各检测结构只负责检测特定尺度的人脸。在DiscROC和ContROC评估标准下,人脸误检数为1000时,相比未使用上述方法的MobileNet模型,YOMO模型的召回率分别提高2.7%和2.8%;(3)通过优化YOMO网络模型的激活函数、梯度优化策略,提高模型的检测精确度。本文还提出背景填充算法、半软随机裁剪算法和椭圆回归器。其中背景填充算法能保持图片在训练和测试时的特征分布一致;半软随机裁剪算法可平衡训练时各检测分支的训练样本数量;而椭圆回归器将矩形预测边框回归至椭圆边框。上述3种方法使模型在ContROC评估标准下的召回率分别提高1.5%,2.5%,8.7%;(4)基于FDDB数据集,在DiscROC和ContROC评估标准下,对基于区域推荐方法、基于网络级联方法、基于回归方法的人脸检测模型进行实验分析。实验结果表明,本文提出的YOMO模型在具有较高检测精确度的同时,在模型体积、检测效率等方面均具有较大优势。