论文部分内容阅读
在计算机视觉领域,以行人为研究目标的问题众多,行人检测及人数统计是其中的两大研究重点,具有广泛的应用领域,包括智能驾驶,智能监控等。本文针对行人检测以及人数统计领域中存在的主要问题,进行进一步的研究与改进。主要内容如下:第一,由于所研究的行人检测算法和人数统计算法都是以卷积神经网络(Convolution Neural Network,CNN)为基础,所以本文首先对卷积神经网络的发展历程,基本结构以及典型的网络模型进行简要介绍,为后文的算法研究奠定知识基础。第二,提出一种基于卷积特征金字塔和单映射多候选框检测算法(Single Shot MultiBox Detector,SSD)的行人检测网络框架。针对行人漏检率高的问题,提出利用卷积特征金字塔有效融合低层卷积特征的空间信息和高层卷积特征的语义信息,显著降低行人漏检率。并为了进一步提高对小目标的检测准确度,提出将低层(非检测层)的卷积特征通过局部特征跨通道重排的方式与检测层相结合,效果显著。另外,通过引入比VGGNet性能更好的稠密连接卷积神经网络(Dense Convolutional Network,DenseNet),进一步提高网络性能。第三,提出一种结合VGGNet和多列卷积神经网络(Multi-Column Convolutional Neural Network,MCNN)的人数统计算法。针对MCNN网络训练过程复杂,过拟合风险大的问题,提出利用预训练网络VGGNet的迁移学习来简化网络及训练过程,提高网络准确度,降低过拟合风险。同时,为了降低大比例下采样造成的准确性能损失,提出一种基于转置卷积上采样的人数统计算法,进一步提高人数统计准确度。第四,为了进一步提高行人检测和人数统计算法的实时性能,本文研究了一种基于深度可分离卷积的模型加速方法,显著提升了行人检测和人数统计网络的运行速度。