面向人脸检测的深度神经网络模型优化研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:hhy0412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测技术是判断一张图像里面是否存在人脸,如果存在,就输出人脸的位置,作为人脸识别、人脸表情识别和人脸对齐等任务的基础步骤。在实际应用中,这些任务对检测器的检测速度、准确率和模型大小都有着严格要求。基于深度学习的人脸检测方法主要分为两类。一类是两步式,先在原图上生成候选窗口,然后再进行分类定位。另一类是单步式,直接在原图上进行人脸检测。前者检测准确率高,后者检测速度快。尽管两种策略在准确率上已经能满足实际应用的要求,但是庞大的检测器模型限制了其应用场景。面对这种情况,本文的主要工作如下:(1)本文采取级联神经网络的策略,使用三阶段级联结构对检测器进行简化。第一阶段网络负责提名候选窗口,第二阶段网络负责对提名窗口进行修正,第三阶段网络负责输出包含人脸的窗口位置。(2)现有三阶段级联卷积神经网络在追求模型小的同时,在准确率上付出了一些代价。本文提出一种深度高效的人脸特征模块,能够提升准确率的同时不增加参数量。(3)本文同时提出一种端到端级联神经网络结构,很大程度上简化了级联神经网络的训练难度。不仅能够减少大量人工操作,还能缩减三分之二的训练时间。(4)最后针对三阶段级联结构,基于召回率和准确率两个评测指标,对改进前后和端到端的三种模型进行比较。最后,在公开WIDER FACE人脸检测数据集上验证了本文方法的改进效果。在人脸候选窗口提取阶段,本文方法有3%的召回率提升(从80%到83%)。在提名窗口修正阶段,也有着1%的召回率提升(从84%到85%)。在输出人脸窗口位置阶段上,召回率和准确率同时提升了2%(准确率从90%到92%,召回率从88%到90%)。实验结果证明,本文方法能检测到更多的人脸。
其他文献
现代陶艺是当代艺术的重要组成部分,它具有独特的陶瓷材料语言。本次创作以物质形态的转换为重点研究内容,借助钢筋、石头、漆器的物质形态并转换成陶瓷材料语言,营造人类社会与自然环境相冲突的氛围,来表达对人类与自然之间关系的思考,引起人们对现代社会矛盾的反思。同时,通过多物质形态的转换,探索陶瓷艺术在现代设计语境下的表达形式。
传统村落寄托着中华各族儿女的乡愁,保护与发展是当前面临的主要问题。随着乡村振兴以及社会主义新农村建设的推进,传统村落的开发势在必行。旅游开发是众多开发方式中常用的一种方式,旅游相关项目的开发与推广能给传统村落带来最直观的好处就是知名度的提升和带来经济效益。结合旅游开发来保护传统村落,在保护的前提下进行传统村落旅游开发。分析传统村落和旅游开发的相关概念,梳理国内外相关理论研究和案例,国外理论研究起步
图像分割是图像处理重要的一支,分割结果的优劣会影响图像分析的准确性。目前图像分割主要存在两个问题,一是没有方法能适应于大多数条件下的图像分割,二是没有一个统一标准对分割结果进行评价。这使得图像分割的研究仍具有重要意义。基于阈值的分割在图像分割中应用最为广泛,越来越多的学者将群体智能优化算法(粒子群算法、差分进化算法等)与传统阈值分割方法结合。将目标函数极值所对应的解作为图像多阈值分割的最优阈值。仿
近年来,光纤传感技术得到了极大的重视。随着应用环境和及监测变量的不断变化,光纤传感网络逐渐向大规模、多功能的方向发展。为了保证传感数据的准确性,光纤传感网络需要复用大量的光纤传感器。大量的光纤传感器被埋置在大型结构内部,在各种恶劣的环境下完成监测工作。同时,复用的传感器越多,网络出现故障的概率就大大增加。这就要求光纤光栅传感网络有更高的可靠性、可扩展性。所以,研究光纤传感网络的可靠性就显得十分必要
目标跟踪是计算机视觉领域中的一个研究热点,目的是从视频中不间断的定位目标的位置.近几年来,目标跟踪技术取得了长足的发展,被广泛的应用到各个领域,如:军事上的战场监视、民用上的交通监视、医学上的医学诊断等.目前,跟踪算法仍有待解决的问题:1.跟踪算法复杂度高、耗时量大、实时跟踪较为困难.2.目标在运动过程中发生形变、尺度变化以及被遮挡等情况,导致目标丢失,跟踪无效.因此,很难找到具有鲁棒性的通用算法
视频目标跟踪通过对目标对象的特征实现提取,然后在视频帧序列中检测运动目标,从而获得目标的所在位置、运动路径等信息,并且目前已经被大量地应用于安防监控、交通监测、国防侦察等多个现实领域。从Meanshift、Particle Filter和Kalman Filter等比较传统的算法,发展到运用相关滤波与深度学习等理论的最新算法,目标跟踪技术不断取得突破性的进展。但是由于目标跟踪本身的复杂性,现有的跟
本世纪以来,互联网技术和增强现实(Augmented Reality,简称AR)技术快速发展,但基于互联网和增强现实技术的教育教学辅助系统(以下简称增强现实教学系统)的发展比较滞后,无法更深层次的满足当今的教育教学需求。现有的增强现实教学系统大多未基于B/S架构开发,增强现实教学系统的实现一般是基于应用程序的方式,需要用户在计算机上安装特定应用程序才能实现增强现实效果,因此只能为少数学生提供增强现
在公共安全管理中,人群密度通常是需要考虑的重要因素之一,过大的人群密度会因为难以控制而存在较大的安全隐患。人群密度估计是反映拥挤的静态场景下人群的分布。它不仅局限于人群数值的简单估计,还包括人群的密度分布图。人群密度估计已经逐渐成为当前计算机视觉领域一个关注的热点。现有的人群密度估计算法主要是基于深度卷积神经网络的目标检测器来对人群密度进行估计。大部分都是以人群计数为主,忽略了密度分布图的质量,未
HBase是一种面向列式存储的NoSQL(Not Only SQL)数据库,它作为Hadoop生态圈中重要的技术成员,担任着存储管理大数据的任务,HBase凭借其良好的扩展性和高效的读写能力,受到越来越多企业的重视。然而,HBase安全性不高的弱点,也成为许多研究者面临的重大挑战。为提升HBase的安全访问控制性能,提出一种针对HBase的细粒度权限访问控制机制。通过修改优化HBase源码,扩展访
提单是海上货物运输最重要的单据之一,具有货物运输合同的属性,作为一种具有物权特性的凭证是约束承运人与提单持有人的最直接有效的证据。提单条款是承运人与提单持有人权利