基于残差模块和多尺度训练的行人检测研究

来源 :安徽师范大学 | 被引量 : 0次 | 上传用户:david_jts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像和视频的行人检测是行人跟踪、行为分析、步态分析、行人身份识别等研究的基础和前提,也是计算机视觉领域最重要的研究方向之一。随着时代的发展,无论是视频监控、车辆辅助驾驶还是智能机器人,人们对行人检测的需求日益渐长。近年来有关基于深度学习的行人检测算法陆续被提出以解决传统手工方法对行人检测精度低、速度慢的缺点。现有基于深度学习的行人检测算法占用资源大,精度和速度均有待进一步提高,无法满足实时监测的需要。本文以微型YOLO为原型,对基于YOLO算法的行人检测进行研究,并在此基础上对其进行改进。使用SSE算法对候选框进行聚类,采用多尺度训练策略在混合数据集上进行训练,给出的改进模型占用存储空间小,进一步提高了检测的精度和速度,模型的泛化能力得到增强。具体工作如下:(1)对行人检测的研究背景与意义进行阐述,并对传统行人检测与深度学习行人检测的国内外现状进行研究;介绍了行人检测相关技术,包括基于传统方法、深度神经网络的行人检测;对微型YOLO算法进行详细解析,并在INRIA标准数据集上给出了初始实验结果。(2)给出了改进YOLO网络结构的行人检测模型。对yolov3-tiny网络结构进行了不同方式的改进。为了加快检测速度,采取细粒度多尺度融合方式,在原网络结构最后增加一个特征图输出构成新网络结构yolov3-tiny2;其次为了避免检测过程中信息丢失的缺陷,在原网络模型主干网络位置增加一个卷积层与两个残差模块构成网络模型yolov3-tiny3;最后为验证两者结合是否会具有更大的检测优势,将以上两种方法结合得到yolov3-tiny23。通过实验对比分析,本文提出的网络改进方法在准确率、检测速度和空间资源占用等方面分别有所提升。(3)给出了基于混合数据集多尺度训练的行人检测模型。模型采用SSE优化Kmeans聚类算法的k值,并通过网络训练参数的优化和多尺度训练策略在自定义数据集与标准数据集PASCAL VOC、INRIA上进行分类器训练。实验表明,采用混合数据集多尺度训练方法训练分类器,在维持检测速度的同时,无论是在查准、查全率上,还是在边界框平均交并比上都得到了进一步的提高,模型泛化能力更强。
其他文献
本文基于传播效果理论、信任理论以及风险社会放大理论三个理论视角,以青岛市民为研究对象,利用2019年青岛市民雾霾风险感知状况抽样调查数据,旨在研究青岛市民群体对雾霾风
在行人动力学研究中,研究行人的运动规律,可以为建筑设施设计、活动应急预案编写提供有力的理论支撑,保障公共安全。基本图是行人动力学分析中一个有效的工具。近些年来深度
随着国民经济的飞速发展和中厚板生产控制技术的不断提高,用户对厚板、特厚板的需求量不断的增加,对产品综合性能的要求愈加严苛,而中厚板在生产过程中,由于压下率有限,普遍
我国现行的沥青路面设计方法指导建设了大量沥青路面,为我国交通事业的发展作出了重要贡献,同时也暴露出了越来越多的问题。现行的沥青路面设计规范规定在沥青路面结构层设计
铬污染水体的治理是当前亟待解决的问题之一,零价铁(zero-valent iron,ZVI或Fe0)由于价廉易得且毒性较低、使用方便而被广泛用于除Cr(VI)。然而,普通零价铁去除Cr(VI)的反应活性较
结合界面是复合轧辊的重要组成部分,高速钢复合轧辊的性能与结合界面的性质密切相关。本文首先根据复合铸造轧辊凝固过程的温度场模拟结果,拟合出结合界面处的温度随凝固时间
机器学习是人工智能的核心研究领域之一,是实现智能化的根本途径。传统机器学习通常假设数据独立同分布,并需要足够多的标记数据以获得较好的学习器。随着机器学习技术向更多
在当今的大数据时代,人们的生活方式发生了翻天覆地的变化,同时人们周围的信息和数据也呈现出爆发式增长。在这样的时代背景下,研究工作者们致力于探究快速、高效且精确的信
液压行驶系统因具有响应快、控制精度高、输出扭矩大的特点,近年来在农用履带式作业车辆上得到了广泛的应用。农用履带式作业车辆采用液压传动方案代替一些复杂的机械传动中
金属-有机框架(MOFs)因具有合成简单、结构有序而且孔径可调、形状多样、比表面积大、易于功能化等优点而在化学、材料、生物分析等领域具有广泛应用。以卟啉及其衍生物为有机