论文部分内容阅读
近年来,随着大数据以及计算机硬件的不断发展,深度学习的热潮带领着人工智能技术与计算机视觉领域进入了发展黄金期。行人检测是计算机视觉领域中目标检测的一个重要分支,行人检测在许多人工智能领域中发挥着重要的作用,例如:自动驾驶、人机交互以及智能监控等。与传统的行人检测相比,深度学习方法采用卷积神经网络学习特征,在行人检测的精度上具有一定优势,但是还是存在一些问题,例如:小尺寸行人漏检问题,行人遮挡问题等。这些问题导致了行人检测与计数在实际场景中难以广泛应用。本文针对以上问题,进行了基于深度学习的行人检测与计数的研究。本文主要工作和创新点包括:(1)数据集的建立。目前大多数数据集都是采集于欧美地区,而国内的实际交通情况与人员特征与欧美地区有一定区别。为了提高算法实际应用的适应性,根据天网监控系统的视频监控数据建立了行人检测数据集。(2)小尺寸行人检测。天网监控系统中的监控设备高度较高或者与行人距离较远都会导致画面中经常出现较小尺寸的行人。并且监控存在分辨率不统一的情况,因此需要对训练图片进行裁剪和拉伸。图片在经过裁剪或拉伸之后将会有一定程度的扭曲,从而导致检测不到小尺寸的行人。本文研究了基于空间池化金字塔结构以及多尺度检测策略的行人检测网络。(3)遮挡行人检测。现实生活中,行人由于背景复杂、姿态各异会导致行人遮挡问题,包括人被物遮挡和人与人遮挡。随着网络深度的增加,被遮挡的行人的特征信息在多层网络特征提取与传递过程中会逐层丢失。为解决这一问题,本文提出了结合Res2Net来通过更细粒度进行表示多尺度特征,并且提升了各层网络层的感受野范围。实验结果表明,整个网络能够有效地减少信息丢失,实现网络多层特征复用及融合,能够快速有效地对有遮挡行人进行检测。