基于深度学习的行人检测及其应用研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:kobeantoni198774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对行人检测过程中人的形体变化大、场景复杂、存在遮挡等特点,本文重点研究基于深度学习算法的行人检测技术。本文首先研究了基于Faster R-CNN深度学习方法的行人检测,把行人检测问题转化为提取行人候选区域再分类的问题:先利用卷积神经网络RPN提取行人的候选区域,接着用Rol池化层进行尺度归一化,最后输入到Softmax分类器和边界框回归器进行分类和行人的定位。本文通过挑选训练样本、调整网络、训练参数重新进行了端到端的检测器训练,提高了检测性能。其训练所得的Faster R-CNN行人检测器在INRIA数据库测评的平均漏检率为9%,在Caltech数据库测评中,平均漏检率低于大多数传统方法,其中相比HOG方法,分别降低了 37和49个百分点,通过实验验证了 Faster R-CNN深度算法应用于行人检测的有效性和实际应用性。接着本文首次将R-FCN深度学习方法应用于行人检测。该方法使用具有强大特征表达能力的残差网络作为基础网络,除了提取行人的候选区域,还提取针对行人相对位置敏感的特征,这使得检测器在检测过程中能够更好地适应行人的平移变换。在严重遮挡场景下,R-FCN方法的漏检率低于所有传统方法以及两个最新的深度学习方法(RPN+BF和F-DNN),其中,比HOG降低了 44个百分点,比RPN+BF降低了 22个百分点,证实了 R-FCN方法在行人存在严重遮挡情况下,具有很好的检测性能。最后本文研究了基于SSD多尺度的行人检测。本文训练所得的SSD检测模型在Faster R-CNN的基础上进一步降低了平均漏检率,并提高了检测速度。在INRIA数据库中,通过与多个传统方法以及RPN+BF和F-DNN进行多种尺度数据集下的性能评估,SSD检测模型平均漏检率为8%,比RPN+BF和F-DNN方法高1个百分点,但在检测速度上有较大提高。其结果表明,SSD行人检测器具有较好的应用价值。本文还对所训练得到的Faste R-CNN、R-FCN及SSD检测器进行综合性能分析。
其他文献
作为我国重要区域之一,西藏的城镇化是我国现代化建设的很重要的一部分。在西部大开发、新型城镇化战略之下,找到符合西藏情况独特的城镇化道路、推进西藏城镇化进程,对于推
微模型试验技术具有模型规模小、试验周期短和经济性好等优势,可用于研究大范围和复杂系统的江湖关系问题,但国内应用实例较少,其相似理论和模型设计关键技术值得深入研究。
中国的特殊改革模式虽然赋予了技术官僚精英以特殊的重要性,但也让他们担当了本不属于他们的额外使命在最后一次复出之后,邓小平曾用他一贯的通俗风格道出一句名言:好的制度
人们往往把行政体制改革的目光过多地集中在政务官身上.而没有看到行政机构内部技术官僚体制改革的必要性和紧迫性。事实上.当前行政效率不高的问题绝大部分是由于行政机关内部
人体的自然呼吸在讲述管乐器的呼吸之前,首先应把呼吸的原理和与呼吸有关的呼吸系统各个部位的构造用生理学的论据加以简述。人体的自然呼吸功能简单地说是从外界吸入新鲜氧气
目的:探讨人口老龄化背景下养老机构发展存在的困境和趋势,并提出相应管理对策。方法:通过实地考察、访谈、问卷调查等方法,收集当地10家养老机构的数据资料,分析存在的问题
基于2011-2017年跨国装备制造企业数据,建立GMM动态回归模型,验证了制造业服务化对制造企业技术创新效应的影响。研究发现,在制造业服务化转型中,会通过投入服务化过程增加企
通过可视化建模的方法,在ANSYS的基础上模拟了交流接触器的稳态温度场分布。该交流接触器模型以动静接触组作为单一热源,主要建模步骤分为:3D模型创建、网格划分、前处理(包括定
后工业化境遇下不确定性丛生,为推进一种网络结构的多元合作治理体系的形成,建构实施共享领导的服务型政府势在必行.服务型政府简单理解为政府公共服务职能的放大,甚至与“公
高职院校为生产、建设、管理、服务一线培养高素质技能型人才。构建具有高职特色的“双师结构’教学团队对提高高职教育人才培养质量至关重要。文章在对我国高职院校教师队伍