论文部分内容阅读
视频中的非特定异常事件时空位置检测在学术界和工业界都受到广泛关注。能够自动检测监控视频中的异常事件的智能监控系统对于公共安全有着极其重要的意义,传统的监控系统严重依赖人力,监控视频通常只能作为事后取证的依据,当异常发生时无法及时发出警报,这种现象在人群比较密集的情况下就更为严重。除了及时定位异常之外,对已经有的监控视频进行异常事件时空位置检测也很重要,可以帮助相关的决策部门对监控设施安装、治安调配等政策作出有针对性的调整,然而随着监控摄像头设备的逐年增加,以及设备产生的新数据源源不断增加,人类很难处理这么多的数据,在这种情况下就更需要有能够实现监控视频中自动检测异常事件的技术。尽管能够自动检测监控视频中的异常事件的智能监控系统有很重要的意义,场景的复杂性、异常行为的欺骗性等等使监控视频中的异常事件仍然是一项非常具有挑战性的任务。该任务的难点一方面在于异常事件检测任务本身,由于本文的任务是一种无监督的学习任务,即训练集中只有正常数据,需要在既包含正常数据又包含异常数据的测试集中找到异常数据,这就为我们如何形式化表示正常数据、如何为正常建模等等提出了挑战;该任务的另一个难点来源于监控视频这种数据形式,目前在计算机视觉领域,很多基于图像的任务已经取得了突破性进展,但是很多基于视频数据的任务,无论是在学术界还是工业界还仍然很有挑战性。这主要是因为对于视频的时序信息和特征还没能处理得很好。此外,监控视频的低分辨率、低画质等特征也为基于其上的工作带来了难点。本文将会对这些难点详细展开阐述。为了解决这些难点,本文提出一种称为2stream-VAE/GAN的异常检测算法,通过将变分自动编码器/生成对抗网络(VAE/GAN)嵌入到双通道网络结构中,综合考虑空间和时间信息,可以捕获视频数据的正常属性并实现异常检测。具体来讲,我们用VAE/GAN为训练集中的正常监控视频数据建模,也就是用VAE/GAN来描述“正常”,然后结合双通道网络结构,为训练集中的正常外观特征和正常动态特征建模,这样我们可以训练一个定义“正常”的模型。基于某些异常检测规则和上述预训练的定义了“正常”的模型,我们可以自动检测和定位测试集视频中的异常事件。我们在两个公开标准数据集上验证了我们的算法效果。另外,我们还实现了一个能够自动检测、定位监控视频中异常事件的智能监控系统,该系统既能应用在在线场景,及时检测监控视频中的异常事件,也能应用在离线场景,检测存储于本地硬盘或者本地文件系统监控视频中的异常事件。我们将展示了我们的系统流程图、体系结构、功能和界面。