基于深度学习的视频人脸表情识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:w527369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频人脸表情识别是计算机视觉和人机交互领域的一个重要分支内容,面部表情是人类情绪的真实表达。研究自动面部表情识别可以帮助机器理解人的情感,在人机交互中更好与人沟通。在早期的研究工作中,视频人脸表情识别一般采用传统图像算法(如光流法等)取表情特征,再将特征送入分类器进行分类训练。该方法高度依赖于图像及特征取的质量。此外,现实场景中人自发产生的表情图像易受光线、姿态等干扰,将大大降低传统图像算法的鲁棒性。随着深度学习方法在图像分类、视频识别等领域上取得重大进展,越来越多的学者开始关注基于深度学习的视频人脸表情识别的方法研究。在近几年的视频人脸表情识别研究中,常用卷积神经网络和循环神经网络对视频图像中的人脸表情特征进行取,并通过分类器进行分类,构建一个端到端的视频人脸表情识别模型。本文主要围绕基于深度学习的视频人脸表情识别方法展开研究。首先,对深度神经网络的理论知识进行了详细的阐述。其次,总结了利用深度学习方法实现视频人脸表情识别的主要算法及模型。针对视频人脸表情识别的特点,深入研究了图像预处理、卷积神经网络模型预训练等问题。然后,对于视频中的单帧,出了基于双线性模型取表情图像二阶信息进行分类的端到端方法。对于视频中连续帧,出了结合帧间信息与非局部网络全局信息的识别方法。最后,利用深度模型压缩算法压缩模型大小,在移动端开发了实时的视频人脸表情识别演示系统。本文的创新点体现在六个方面:1、出一种改进型人脸对齐算法。2、基于VGGNet出一种改进型卷积神经网络结构。3、利用迁移学习,在大规模表情数据集上对模型进行预训练。4、基于细粒度分类思想,利用双线性模型取表情图像二阶特征进行分类。5、出利用门控循环单元与非局部网络结合的方法,取表情局部和全局特征并融合时序信息,对连续帧表情图像进行分类。6、利用模型剪枝算法压缩模型,并开发完成一套实时视频人脸表情识别演示系统。
其他文献
随着互联网应用的高速发展和云计算的兴起,数据的生产速度越来越快,数据中心内每秒钟都有大量较小文件的生成、分析和返回。海量数据的处理和应用已成为当今信息技术领域所面
2016年3月,李克强总理在政府工作报告中首次提出“培育精益求精的工匠精神”。2016年4月,习近平总书记在知识分子、劳动模范、青年代表座谈会上也指明要弘扬“工匠精神”。20
目的:探讨育龄妇女妇科病普查情况。方法:回顾性分析我院参与妇科病普查的3458例育龄妇女的临床资料。结果:患病率为45.7%;病种以宫颈炎、阴道炎为主;宫颈炎、宫颈糜烂患病率随年龄
通过清污分流,利用混凝-CASS澄-清砂滤工艺处理漂染厂废水。工程运行结果表明:经分流后,CODC r平均865.4 mg/L,色度356倍的高浓度废水,处理后分别降至62.9 mg/L和17倍,实现了达标排放;低浓度废水CODC r平均216.9 mg/L,色度85倍,处理后分别降至3.1 mg/L和1倍,直接回用于生产,废水回用率达到近70%。
随着经济全球化深入发展,金融业已经成为现代经济的核心,经济的发展需要金融的支撑,而金融的发展也需要以经济发展为基础。据初步统计,目前全国先后至少有26座城市提出以建设区域
改进LMA451-A-180型预缩整理机的控制系统,其硬件采用西门子S7-200系列的CPU224加外扩I/O模块及数/模模块的混合式结构,实现了多点输入、输出的控制,通过软件编程用OTP(触摸屏)实
互联网的迅速发展,使得信息量急剧增长,为用户带来便利的同时也面临着信息过载的问题,因此推荐系统作为一种有效的解决方法迅速发展起来。推荐算法作为推荐系统的核心,近些年受到了广泛的研究。矩阵分解是推荐算法中常用的一类经典而重要的技术,到目前为止仍受到广泛的关注和研究。传统的矩阵分解利用用户隐特征和物品隐特征的内积来预测评分,但是该方法通常会面临数据稀疏性的问题。近年来,深度学习在自然语言处理和图像分类