基于计算机视觉的行人检测与人数统计算法研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:engcourse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域,以行人为研究目标的问题众多,行人检测及人数统计是其中的两大研究重点,具有广泛的应用领域,包括智能驾驶,智能监控等。本文针对行人检测以及人数统计领域中存在的主要问题,进行进一步的研究与改进。主要内容如下:第一,由于所研究的行人检测算法和人数统计算法都是以卷积神经网络(Convolution Neural Network,CNN)为基础,所以本文首先对卷积神经网络的发展历程,基本结构以及典型的网络模型进行简要介绍,为后文的算法研究奠定知识基础。第二,提出一种基于卷积特征金字塔和单映射多候选框检测算法(Single Shot MultiBox Detector,SSD)的行人检测网络框架。针对行人漏检率高的问题,提出利用卷积特征金字塔有效融合低层卷积特征的空间信息和高层卷积特征的语义信息,显著降低行人漏检率。并为了进一步提高对小目标的检测准确度,提出将低层(非检测层)的卷积特征通过局部特征跨通道重排的方式与检测层相结合,效果显著。另外,通过引入比VGGNet性能更好的稠密连接卷积神经网络(Dense Convolutional Network,DenseNet),进一步提高网络性能。第三,提出一种结合VGGNet和多列卷积神经网络(Multi-Column Convolutional Neural Network,MCNN)的人数统计算法。针对MCNN网络训练过程复杂,过拟合风险大的问题,提出利用预训练网络VGGNet的迁移学习来简化网络及训练过程,提高网络准确度,降低过拟合风险。同时,为了降低大比例下采样造成的准确性能损失,提出一种基于转置卷积上采样的人数统计算法,进一步提高人数统计准确度。第四,为了进一步提高行人检测和人数统计算法的实时性能,本文研究了一种基于深度可分离卷积的模型加速方法,显著提升了行人检测和人数统计网络的运行速度。
其他文献
MIMO(Multiple-Input Multiple-Output,多输入多输出)无线通信系统,相对传统的单天线系统,可以提供更高的系统容量与通信质量,近年来已成为无线通信领域中的一个研究热点.而M
正交频分复用(OFDM)技术具有频谱效率高、抗多径能力强、传输性能好、硬件实现方案简单等特点,在无线通信领域获得了广泛的运用,使其成为LTE及LTE-A的关键技术之一。近十几年
近年来,随着计算机技术与无线局域网技术的飞速发展和广泛普及,信息时代正在转型为智能时代。移动及无线技术作为智能时代的重要标志和依托之一,其优势已经在与人们生活息息相关
说话人识别技术与其他生物识别技术相比,具有更为简便、经济和更好的可扩展性等优点。目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但当用于识别的语音存在失真
Ad hoc路由协议根据它们的路由策略的不同,总的来说可以分为table-driven和on-demand-driven两类。Table-driven路由协议要求每个网络节点的路由表中,要存有到所有可能的目的