【摘 要】
:
人脸检测是一个复杂的模式判别问题,其难点主要由成像角度不同所引起:如平面内旋转和平面外旋转,偏转角度会直接影响判定人脸的准确度。当前基于深度学习卷积神经网络的检测
论文部分内容阅读
人脸检测是一个复杂的模式判别问题,其难点主要由成像角度不同所引起:如平面内旋转和平面外旋转,偏转角度会直接影响判定人脸的准确度。当前基于深度学习卷积神经网络的检测方法虽然有着很高的检测率,但是在神经网络的输出层对人脸的处理不够精确,忽略了一张人脸对应的多个检测窗口之间的关联关系,从而导致最终人脸框不够精确。结合条件随机场模型CRF对神经网络的输出层进行调整,使得最终的人脸框更加精确。提出了一种基于卷积神经网络和条件随机场模型的人脸检测方法CRF-CNN,该方法提高了最终人脸框的精确度。方法首先对卷积神经网络进行训练,得到判定人脸和非人脸的分类器,对输入图像进行滑动窗口人脸检测,得到包含人脸的窗口;然后标注同一张人脸对应的所有检测窗口,窗口对应的置信分作为条件随机场CRF的随机变量,通过CRF模型计算窗口之间的关联关系,根据关联关系的紧密程度对窗口进行取舍;最后根据面积重叠的大小和横向距离、纵向距离重叠的大小分别对同尺度和不同尺度的窗口进行合并,得到最终的人脸框。为了使得检测率更高,该方法还对输入图片做了不同尺度的缩放处理,缩放程度的不同只会很小程度影响检测时间,不会影响检测的正确性,所以本方法对选用何种缩放算法及其参数并不敏感。实验分别与卷积神经网络检测方法DDFD、R-CNN和局部特征检测方法DPM进行了比较。结果表明,CRF-CNN的准确率和召回率与DDFD相近,高于R-CNN和DPM。在面内旋转和面外旋转的人脸检测中,CRF-CNN得到的人脸框更加准确,尤其在面外旋转的人脸检测中,CRF-CNN置信分均值为0.99759,高出DDFD 0.00527。
其他文献
随着基于Hadoop平台的大数据技术不断发展和实践的深入,Hadoop YARN(Yet Anouther Resource Negotiator)资源调度策略在异构集群中的不适用性越发明显。一方面,YARN资源调度
随着信息技术的迅速发展和计算机应用项目的大量推广,网络数据服务中心的数量大量增加。计算机系统的规模也越来越大,其系统性能也不断的提升,计算资源的种类越来越庞杂。在
分类是模式识别及人工智能的重要研究领域,由于分类器的优劣缺乏统一的评价标准,因此寻求提高分类器的准确度和泛化能力成为一个主要的研究方向,为了充分利用不同分类器之间
随着数据挖掘技术的成熟,信息产业的不断涌现,以及互联网的迅速发展,人们日常生活需要的信息量以指数级速度增长。传统的数据分析和查询方法在实际应用中不能满足人们对隐藏
据世界卫生组织的发表《全球疾病负担》[1]评估报告显示心血管疾病已成为全球头号健康杀手,而这其中患者的主要死亡于心脏病和中风。随着近年来心血管疾病治疗技术的进步,外
多径传输使用多条连接流分割节点和流汇聚节点的路径进行传输。相对于传统的单径传输,多径传输具有充分利用网络资源、减少拥塞、提高传输可靠性和提高网络的安全性等优点,是
移动增强现实即在移动设备上将虚拟物体与真实场景进行叠加,实现两者的有机结合。目前大多数移动增强现实技术着重于对摄像头视角内对象进行可视化,但受制于其屏幕限制,无法
日新月异的计算机科学技术的迅猛发展给社会各个领域尤其医学领域带来了巨大的革新,医疗卫生行业逐步实现了信息化。电子病历作为医疗机构最重要的文件,其本身的信息化程度直
图处理系统正被广泛的应用于各个领域的数据分析中,随着图处理任务的增加,它们需要有效的应对多任务环境。现有的图处理系统一般针对单一任务设计,在执行并行任务时存在图数
随着视频共享系统和编辑软件的出现以及广泛使用,共享系统中的视频数量和种类快速增加。在这些海量视频中存在大量重复或在内容上高度近似的视频,增加了用户与视频共享系统之