论文部分内容阅读
随着人类社会活动的增加,各个场景人群的聚集成为社会活动必不可少的现象,如公交站台,体育场和地铁口等,这就增加了事故发生的概率。如何有效地对密集场景进行密度估计,成为众多科研人员的研究重点。针对上述问题,研究人员提出了多种算法进行人群密度估计,例如基于个体特征的分析方法、基于像素的统计方法或是基于纹理的分析方法。传统算法在计算速度方面优势明显,但是在密度估计精度方面尤为不足,特别地当场景存在严重遮挡现象时精度急剧下滑,并且传统算法对高密度场景的密度估计不具有鲁棒性。深度学习在人群密度估计方面后来居上,因其鲁棒性好识别精度高等特点得到了广泛的推广。本文采用深度学习进行密度估计,并根据密度等级的不同,划分为中低密度和高密度两个场景,分别进行密度估计。划分的原因是为了适应场景的变换,在中低密度时基于行人检测的密度估计有着更好的实验结果,有效地解决了传统方法估计不准确性和鲁棒性差的特性。同时为了让此方法可以应用于嵌入式开发和更广的工业领域,本文采用网络压缩的方法对深度学习模型进行了权重压缩,不影响精度的情况下达到压缩网络的目的。1、针对中低密度人群,本文采用行人检测的方法来统计当前静态图像的人数,提出了级联多任务神经网络。算法的优势在于运用了全卷积网络,可以针对任意尺寸大小的图像输入,对解决小目标行人检测效果明显。同时利用了级联网络的思想,检测准确率上有了很大的提升。再者我们利用了多任务深度神经网络,在分类前景背景的同时我们利用边框回归进行行人边框纠正,最终可以准确地回归行人区域,进一步提升行人检测的准确率。2、针对高密度人群,本文采用公开数据集进行算法研究,提出了多列有效卷积核网络(MECK)来分析场景密度。我们优化了损失函数,实验分析出了最佳的损失函数倍数,这使得网络在训练时朝着更加健壮的方向发展。同时我们扩增了数据集,在原有数据集的基础上我们通过不同算法对图像进行了不同程度的变换,优点在于使网络能适应不同的场景,增加了网络的鲁棒性。再者我们优化了网络的训练,解决了因数据集量少带来的非鲁棒性问题和过拟合问题。算法在准确率和鲁棒性方面优于传统算法,在人群密度估计方面有一定的借鉴作用。3、本文采用了自定义的网络压缩模型对多类有效卷积核网络进行了网络压缩,在不影响精度的情况下达到压缩网络的目的。提出了如何针对神对网络进行有效的权重压缩,即如何保证准确率不变的情况下,最大程度的对深度网络进行压缩。既要保证网络深度不变,也要保证网络权重最小是本章研究的出发点。深度学习因网络的复杂性和计算量大的特点很难使人群密度估计算法应用于嵌入式端,本文尝试了浓缩网络模型,简化网络结构,成功将深度网络进行了压缩,在原网络的基础上做了很大的改进,一定程度上解决了深度学习在人群密度估计算法方面嵌入式端的应用。