论文部分内容阅读
经济的迅猛发展推动了城镇化建设的步伐,涌向城市的人口数量日益增加,人口密度不断增大。城市中心和公共区域经常出现人群聚集现象,如果在拥挤的人群中出现了行人摔倒的情况,造成的后果不可轻视,轻微情况下对交通秩序造成影响,严重时会危及生命。例数近年来的全球踩踏事件,造成了严重的生命财产损失。因此监控人群密度并在可能发生异常聚集行为的情况下发出警报显得尤为必要。基于视频监控的人群分析系统相对于人力监控有着天然优势,运用目标识别、目标跟踪等技术,实现人群密度方面的研究。如密度估计和人数统计,以及分析人群中是否存在不正常的行为,这些已逐渐成为智能视频监控方向受欢迎的研究点。本文首先对传统的人群计数算法做了归类分析,然后介绍了近年来基于卷积神经网络的人群计数经典算法架构,对比这些算法分析不足之处,提出了自己改进的算法,并在三个公开数据集ShanghaiTech、UCF-QNRF、UCFCC50上验证了算法的可行性和有效性。其次将改进的网络应用到基于视频的异常行为检测中,实现了基于视频的人群计数和异常聚集预警。本文的具体工作如下:(1)本文以ResNet网络为基础,提出了一种基于全局神经网络的人群密度估计算法。对于像人群密度估计和人群计数这样的任务,模型需要一个较大的感受野,获得大感受野最简单的方式是采用大的卷积核,这会使模型的参数量增大。因此既要实现大感受野又要使模型参数量不能过多,且模型性能不差,本文在残差网络上叠加了两组长条卷积,在获得广阔感受野的同时,使模型能有较好的性能且减少了模型的参数量。改进后的网络模型在ShanghaiTech、UCF-QNRF和UCFCC50三个数据集上训练测试。与MCNN模型相比,MAE与MSE在本文模型上面的表现出色,在ShanghaiTech数据集PartA上分别下降了 33.30%和26.15%,在PartB上分别下降了70.83%和 69.98%。在 UCF-QNRF 数据集上,分别下降了 64.66%和 58.0%。在 UCFCC50 数据集上分别下降了 32.44%和18.80%。与其他模型相比,实验结果表明了改进后的网络模型在各项性能方面有了很大提升,人数估计的准确度大有提高,平均绝对误差和均方误差两项评价指标在此网络下有一定的优势,证明了所提出网络的切实性、有效性和稳定性。(2)本文研究了基于视频的人数统计和人群异常聚集行为检测。将改进的网络模型应用到基于视频的人群异常聚集行为检测当中。采用基于阈值的方法对视频中的异常与否进行判断。首先用k-means方法完成聚类,聚类完成后统计落在不同类中的数据点的个数,形成两类规模,之后定义阈值,以此评估两类规模的差距数值来定义异常聚集,实现视频里的人群计数和人群异常聚集行为的检测。最后在数据集PETS2009和Mall上进行测试。与MCNN模型相比,本文所使用的方法检测出的异常帧数准确度在PETS2009的四个视频序列上分别提高了 6.49%,17.15%,4.62%和9.70%,在Mall上提高了 14.25%。实验结果证明了改进网络的可行性以及所用方法的有效性。