论文部分内容阅读
随着社会经济的飞速发展,公共安全已经成为全民关注的热点问题,视频监控技术随之得到了广泛的普及。如今,智能视频监控系统已经大量应用在交通路口、火车站、机场、大型商场、广场等公共场所。作为智能视频监控领域中的重要内容,目标计数在实际生活中有着大量的应用场景,准确的估计出目标在图像中的具体数目是相关任务的关键。在智能交通系统中,准确的估计出交通场景中的车辆数目可以为交通管理部门进行公共交通管理提供重要依据;统计商场的客流量信息可以帮助商家进行科学的资源分配;对大型公共场所的人群密度进行监控可以及时发现安全隐患并提供预警。计数任务的目标是让计算机准确的估计出图像中的相关物体数量。根据应用数据来源的不同,可以将目标计数任务分为视频中的目标计数和单一图片中的目标计数。本文分别针对这两方面进行了深入研究,根据实际应用场景的不同特性,分析了已有算法所存在的问题,提出了具有针对性的目标计数算法。本文的主要研究工作和贡献可概括如下:1)针对视频中的目标计数问题,本文重点考虑交通视频中的车辆计数问题。目前,基于视频图像的目标计数算法大多是在像素域中进行的,像素域中包含丰富的可提取信息,可以取得较为精确的计数结果。然而,在实际监控系统中,监控视频数据一般是以压缩的形式进行传输和储存的,像素域处理方法需要先将压缩域数据完全解压之后才能进行,算法复杂度高。对此,本文提出了一种直接在压缩域视频中进行车辆计数的方法。首先,为了解决压缩域中的信息不足和噪声干扰问题,提出了多样化的丰富特征提取方法,充分利用了压缩视频流中的运动矢量和宏块编码模式信息。其次,针对实际交通场景复杂多变的特性,提出了一种基于分层分类的回归模型来进行车辆计数,将复杂场景逐步细化,并采用特定模型实现精确计数。最后,在实际交通数据集上的结果表明,所提压缩域算法不仅能达到更高的运行效率,同时在精度上与传统像素域方法也有着相当的表现。2)相比于像素域处理,压缩域本身存在着信息量不足以及噪声干扰的问题,仅在单独一帧上进行回归计数难以保证结果的稳定性。为了解决这个问题,本文提出了 一种基于空间与时间回归的压缩域车辆计数模型。具体来说,先通过空间维度回归在单一视频帧上进行车辆数目估计,再利用目标数量在时间维度上的连续性约束信息建立时间维度上的回归模型,学习车辆密度在局部时间序列上的变化模式,对空间回归的计数结果进一步优化,实现更加精确的压缩域计数。在实际交通数据集上的结果证明了所提压缩域算法的有效性。3)针对单一图片中的目标计数问题,本文提出了一种基于深度卷积神经网络的目标计数框架,利用卷积神经网络模型强大的非线性建模能力进行目标计数。该方法直接学习从原始图片到目标密度分布图的映射,为每个像素点分配一个对应的密度值,图片中各个区域的目标数目可以通过对密度图直接积分得到。为了提高模型的鲁棒性,提出采用空间金字塔池化方法对提取的深度模型特征进行鲁棒性增强,得到了更好的特征表示。此外,为了生成更好的目标密度分布图,提出了一种金字塔分层计数模型,充分利用了卷积神经网络模型中固有的多层级金字塔结构,进一步提高了模型性能。在多个代表性数据集上的实验结果验证了所提算法的有效性。总结起来,本文针对视频监控场景中的目标计数问题进行了深入探索和研究,结合实际应用场景的具体特性,提出了两类目标计数框架,即压缩域视频中的目标计数框架和基于卷积神经网络的金字塔计数网络框架。多个典型数据集上的实验证明,本文在提高目标计数方法的实时性和鲁棒性等方面取得了很好的效果,相较于已有算法均取得了明显进步,展示了其实际应用价值。