基于卷积神经网络的实时性行人检测方法研究

来源 :河北农业大学 | 被引量 : 2次 | 上传用户:nelly45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,公共安全问题越发引起人们的关注。为了更好的解决城市安全问题,在人口密集的地方如商场、学校、电影院、游乐场、各大热门景点等地安装了大量的监控摄像头,这些摄像头汇聚在一起,形成一个巨大的监控网络,每天都会产生海量视频数据。但是处理这些海量视频信息大都采用传统的人工方式,通过人眼“盯屏幕”的方式从海量视频中寻找特定的几个监控信息,这样不仅费时费力、效率低下,而且容易遗漏重要信息,若有紧急情况发生时,也无法在有限时间内快速解决问题。若将行人检测技术应用于智能监控系统,就可以自动检测、识别出视频中的可疑目标,并在发现异常后能够自动报警或采取其他应急措施,将大大提高监控效率,节省大量人力和财力。视频监控下的行人检测问题对于算法的检测精度和检测速度都有较高要求。传统的行人检测方法虽然能够满足速度要求,但在检测精度上差距较远,基于卷积神经网络的目标检测算法检测性能优异,但是直接将目标检测算法应用于行人检测问题上时性能却表现不佳。针对这一问题,本文主要在目标检测算法基础上构建精度更高速度更快的行人检测方法。为解决目标检测算法在行人检测问题上性能表现不佳的问题,本文主要做了以下三方面的工作:(1)在目标检测领域内领先的两阶段检测框架Faster R-CNN基础上,结合行人单一尺寸信息,改进网络锚点框大小,然后在深度学习框架Keras上对Caltech行人数据集进行实验,实验结果表明该算法提高了行人检测精度,但其检测速度仍然很慢;(2)在单阶段检测框架SSD基础上,采用与Faster R-CNN同样的改进方法进行实验,实验结果表明该算法提高了行人检测速度,但却无法保持与Faster R-CNN一样的检测精度;(3)综合分析Faster R-CNN和SSD两种检测器在行人检测问题上的优缺点得出了一个解决方案,即将两级检测器工作流程简化为单级检测器,因此,本文在SSD算法基础上进行了以下三方面的改进:一是采用图像分类效果最好的resnet50作为SSD算法的骨干网络来提取图像特征;二是为适应行人检测,增加行人尺寸信息,调整网络锚点框大小;三是改进定位和增加IOU阈值。借鉴Faster R-CNN中默认锚点框的两步预测机制,一步是RPN预测,另一步是ROI预测,将RPN预测应用于在SSD算法中,通过堆叠一系列的预测器,逐步直接演化SSD的默认锚框来改进定位,再利用多次提高IOU阈值来挖掘更难的负样本,从而提升检测效果;提出了一种新的单阶段行人检测器,既享有SSD的速度同时又保持了Faster R-CNN的检测精度,并在Caltech行人检测基准上实现了不错的检测效果。
其他文献
企业并购发展史在国际上来说已有一百多年的历史。时至今日,西方国家已经经历了5次企业并购浪潮。我国企业并购虽起步较晚,但发展迅速。2015年,我国共完成了2692起并购交易,其中,共有80起物联网企业的并购案例。物联网行业是当前最具发展潜力的行业之一,也是我国积极进行战略布局的行业之一,未来将呈现快速增长的态势。当前,物联网行业竞争激烈,企业间规模整合问题突显,如何扩张便成为众多物联网企业进一步成长
交替传译是一种广泛应用于各种场合的口译形式。其最显著的特点就是信息量大,时效性强。讲者讲话时,译员一边记录,一边进行信息处理。讲者结束一段发言后,译员必须在短时间内
随着互联网技术的高速发展,各个领域均会产生待处理的大规模数据。如何对这些数据进行处理和分析,成为了当代的研究热点。粗糙集理论为数据挖掘提供了一种有效地处理冗余数据的手段。但对数值属性进行处理时必须先将其离散化。模糊粗糙集能够直接对数值属性进行处理,减少了因数据离散而带来的数据信息损失和避免数据结构被破坏的优势,能够有效地对数据进行处理,已成功应用于数据挖掘、医疗诊断等领域。为了降低样本分布和类噪声
社会资本概念在1985年由布迪厄明确进行了界定,在此之后,科尔曼对社会资本理论进行了系统研究,随后普特南将这一概念全面引入经济和政治研究领城并得到广泛关注,并由此引发了大量学者进行研究,与之相关的社会科学文献数量呈现指数式的增长。学者们从不同的视角出发,探索了社会资本对个人、公司、社会,甚至对国家经济发展的影响。研究普遍认为,社会资本作为一种影响人们行为方式的制度、关系、态度与价值观念的综合体,对
《人民日报》是党的机关报,社论作为机关报园地,始终与党中央保持高度一致,积极宣传党的最新理论政策,对马克思主义大众化不断进行诠释。1989-2002年,马克思主义中国化面临新
中文分词是中文自然语言处理中最重要的一步,分词结果的好坏会严重影响后续任务的性能。目前的研究工作中多是使用深度学习方法来进行中文分词。这些研究工作大多数只用到句子中局部的上下文信息。近年来,将中文分词当作机器翻译问题来解决的新思路受到较多关注。基于这种思路的中文分词方法利用机器翻译模型直接对整个语句进行处理,能有效的利用全局的上下文信息。然而,机器翻译模型在翻译的过程中产生的错误翻译会导致分词的准
共振电子复合过程,是指一个自由电子被靶态离子共振俘获形成复合离子的共振激发态,随后通过辐射衰变放出光子的过程。共振电子复合是高温等离子体中的重要动力学过程,影响着
单图像超分辨率重建由于其在恢复图像细节和纹理方面具有很高的现实价值,所以一直是计算机视觉和图像处理领域的研究热点。深度神经网络能够学习低分辨率图像到高分辨率图像
离群点检测能够挖掘出大量数据中包含有价值信息的少量数据,在实际生活中有着广泛的应用,因此离群点检测成为了数据挖掘中的热点问题。离群点检测的主要任务是检测出异常的数据,从而在这些异常数据中获得有价值的信息。基于密度的离群点检测和基于聚类的离群点检测是目前研究的热点问题。本文深入分析了离群点检测的相关方法,针对基于密度和基于聚类的离群点检测中存在的一些挖掘性能不佳的问题提出了改进策略,旨在提高离群点的
伴随着《纺织工业“十三五”发展规划》的发布,中国的纺织行业正逐步迈向工业4.0时代。与互联网、大数据等技术的深度融合,各式各样的数字化智能纺织产品层出不穷,与此同时,