论文部分内容阅读
近年来,由于人口的快速增长,因人群密集引起的骚乱事件频繁发生,所以对人群聚集的场合进行监控变得格外重要。采用计算机视觉的方法来对密集场合中的人群进行密度估计、行为分析也成为了当前一个热门研究方向,具有广泛的实际应用价值。本论文针对两方面开展研究:人群区域密度等级估计和人群数量估计,其中密度等级估计是将人群区域划分为如高密集度、中等密集度、低密集度的等级,并在高密集度时进行报警。传统的研究方法大都基于如下框架:1)提取人群区域内的特征,如纹理特征,小波特征。2)通过目标检测或回归模型的方式估计人数。然而在密集的场景中,个体在人群中的分布呈多样性,加之复杂环境下的目标遮挡,光线改变,给高性能的特征描述和人群数量估计带来困难。近年来深度学习算法在计算机视觉领域取得了不断的成功,相关研究表明深度神经网络学习的图像特征较传统图像特征有更强的泛化性、代表性。借鉴前人研究工作的基础上,本文通过大量的试验研究,提出了一种基于深度卷积网络的密集人数估计和人群密度等级分类算法,通过使用两路监督信号的学习方法,增加了网络学习的鲁棒性,抑制了学习过程中可能出现的过拟合。本文的主要工作如下:1)采用卷积神经网络来对图像区域内的人群特征进行提取。经过对网络特征的学习将区域内的人群划分密度等级从而完成人群高密度预警的任务。2)提出了两路监督信号的学习方法。一路信号用来分类区域内的人群密度等级,另一路信号用来对区域内的人群数量进行回归学习,实现对区域内的人群数量估计。两路信号的学习方法也增加了网络学习的鲁棒性,提高了人数估计结果准确性。3)在实验验证中,我们在自己创建的数据集AHU-CROWD,以及当前常用的公开数据集,包括UCF-CROWD,UCSD上进行了实验。结果表明相比于之前的研究,本论文方法在人数估计准确率上有了显著的提高。