基于深度学习的实时视频人脸识别方法的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xingyu2266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能产业的发展,计算机视觉在人们的生活和各种行业中占据了越来越重要的地位,大面积应用于交通出行、平安城市、无人机、金融服务和机器人等场景中。其中,视频中人脸识别技术是计算机视觉领域的一个核心研究问题。目前,静态图像中的人脸识别技术已经逐渐成熟,准确率也比较高,但是将其应用于视频中的人脸识别时,算法的时效性比较差,无法满足视频中人脸的实时识别需求。针对视频中人脸的实时识别需求,本文基于Caffe框架,在LFW和YTF公开人脸数据集及摄像头拍摄的视频数据集上,提出了一种基于深度学习的人脸识别框架,并针对其准确率和时效性问题进行了持续改进。主要工作如下:1、提出了一种基于深度学习的人脸识别框架FR-DL,集成了 MTCNN人脸检测、仿射变换人脸对齐、lightened CNN人脸特征提取和余弦距离人脸匹配等。2、将视觉跟踪引入到FR-DL中,提出了一种基于视觉跟踪的实时视频人脸识别框架RFRV-VT。框架将视频进行分组识别,组内实现人脸识别和人脸跟踪,组间采用双重匹配实现人脸信息连接。为了进一步提高RFRV-VT的时效性,将哈希索引引入到人脸匹配中,把人脸特征转换为哈希特征,并采用两阶段匹配方法进行人脸匹配得到新的框架RFRV-VT+,大幅度提高了 FR-DL的识别效率,满足了实时人脸识别的需求。3、设计了一种基于ResNet残差结构的人脸特征提取网络32RBSNet和一种特征融合方法,将二者结合生成了一种人脸特征提取算法FFA-32RBSNet,并将之应用到RFRV-VT+中得到新的框架RFRV-VT++。以轻微降低RFRV-VT+的时效性为代价,较大幅度地提高了 RFRV-VT+的识别准确率。实验结果表明,本文提出的框架在持续改进后,能够很好地满足视频中人脸的实时识别需求。最后的RFRV-VT++框架识别准确率达到99.48%(LFW)、94.2%(YTF)和99.6%(监控视频数据集),时效性达到27.4帧/秒(YTF)和30帧/秒(监控视频数据集)。
其他文献
在社会语言学中,"言语社区"是一个重要的概念,作为一个可观察、可度量的实体,"言语社区"为语言使用及文化背景等相关研究提供了一个重要的角度。如何发现和界定一个言语社区
全域旅游的本质就是实现区域资源有机整合、产业融合发展、社会共建共享,以旅游业带动和促进社会的协调发展。在这一理念的指导下,分析邢台市农家乐发展存在的问题,并且探索
车站无法按期提供常规过站条件时,为保证总工期目标可考虑"先隧后站",即盾构先掘进通过车站后再施工车站主体。该方法存在盾构与车站围护结构冲突、隧道与车站接口止水和盾构
卫生行政处罚信息的公开可以保障公众知情权、提高卫生行政机关公信力,也是监督卫生行政行为、确保行政处罚权依法公正实施的重要措施,更能对卫生领域违法行为起到警示作用。
随着世界经济增长和科学技术的发展,人类在满足日益增长的物质和精神需求的同时,越来越关注自身的健康,也随之使得越来越多的资源投向了医疗服务行业,比如公共的医院,私立的
通州区居住呈现典型的“核心—扩散”型,表现为弧度式由西部向东南扩散;商贸中心的就业密度高,乡镇就业密度低,以城区为核心,就业密度呈现出从中心向外递减;职住空间关系显示
重庆调味品在国内有着极高的市场占有率和晓喻度。2016年,重庆将调味品列入"七大农业特色产业链"之一,提出将进一步加大以花椒、加工辣椒、生姜为重点的调味品产业建设,实现1
在建筑能耗中城市集中供暖能耗占有很大比例,在城市集中供暖能耗中输配系统能耗占有比例同样不容小觑。目前我国城市集中供热采用的传统集中供热输配系统存在诸多不足。近些
智能蒙皮与电子皮肤集成的传感单元的种类日益增加,对传感器规模的需求越来越大。智能蒙皮与电子皮肤应用的优越性能不仅仅体现在传感器件的柔性,在很大程度上也取决于数据采集的可靠性。阵列式传感器的串扰问题、信号处理问题以及采集速度、精度与规模之间的矛盾问题一直制约着阵列式传感器应用的扩展,因此搭建适用于各类传感器的数据采集系统对实现大规模传感器在蒙皮与电子皮肤中的广泛应用是至关重要的。本文围绕常用柔性压力
本文以指导司机这个安全管理核心岗位为切入点,以提升运输一线安全控制能力,确保行车安全为核心,全面论述指导司机在乘务员队伍管理、确保运输生产安全过程的重要性、基本职