【摘 要】
:
人脸表情识别(Facial Expression Recognition,FER)是指利用计算机技术获取人脸表情图像、检测人脸表情区域、提取表情特征和对表情特征进行分类的过程。由于人脸表情识别研究在计算机视觉领域占据着重要的地位,而且也是实现人机交互的关键技术,所以吸引着国内外学者的广泛关注和深入研究。目前,人脸表情识别技术的发展遇到了两个关键性难题:(1)人脸图像中头部姿态的偏转造成面部配准误差
论文部分内容阅读
人脸表情识别(Facial Expression Recognition,FER)是指利用计算机技术获取人脸表情图像、检测人脸表情区域、提取表情特征和对表情特征进行分类的过程。由于人脸表情识别研究在计算机视觉领域占据着重要的地位,而且也是实现人机交互的关键技术,所以吸引着国内外学者的广泛关注和深入研究。目前,人脸表情识别技术的发展遇到了两个关键性难题:(1)人脸图像中头部姿态的偏转造成面部配准误差和面部遮挡,导致难以获取有效的表情特征信息;(2)缺乏足够的训练数据造成训练过程中的过拟合。本文基于生成对抗网络(Generative Adversarial Networks,GAN)提出了一种端到端深度学习框架。在我们所提出的框架中,首先介绍了一种基于ShuffleNet-v2架构的树突状卷积神经网络模型用来估计图像中的人脸姿态。然后,基于框架利用不同的姿态和表情来同时进行人脸图像合成和不同姿态的人脸表情识别。本文研究所提出的方法能够有效地解决非正面人脸表情识别中遇到的问题,具有一定的实用性。本文的主要工作以及创新如下:(1)为了能够在非正面的人脸表情识别中估计人脸姿态,我们提出了一种基于ShuffleNet-v2架构的树突状卷积神经网络模型。该模型使用单个卷积神经网络对人脸特征点的树突状结构进行建模,模型基于ShuffleNet-v2网络架构实现,因此能够在较少参数的情况下维持较好的性能。为了证明方法的有效性,我们分别在AFLW,AFW和300W数据集上进行了大量的实验。通过从人脸特征点定位的归一化平均误差,人脸姿态的估计误差,精确率和召回率四个方面进行实验分析,并与现有的方法进行了比较,结果表明本文提出的算法具有人脸特征点定位准确度高,人脸姿态估计误差低,较好的精确率和召回率的优点。(2)为了提高基于ShuffleN et-v2架构的树突状卷积神经网络模型对人脸姿态估计的准确度,我们提出了一种基于显式人脸姿态估计的特征点定位模型用于模块化辅助任务,实验结果证明这种辅助模型能够有效地对图像上的人脸特征点进行遮挡检测和细粒度定位。(3)为了解决因为缺乏足够的训练数据造成训练过程中的过拟合问题,我们基于生成对抗网络(GAN)提出了一种联合姿态和表情的非正面人脸表情识别模型,该模型通过利用不同的姿态和表情来同时进行人脸图像合成和不同姿态的人脸表情识别。在我们提出的模型中,基于编码器-解码器结构的生成器可以学习人脸图像的身份特征,而且自动生成带有不同标签的人脸图像,丰富实验的训练集,并且我们对模型中判别器进行了小批量处理,直接计算小批量样本的统计特征,简化了计算方式,提高了模型在训练过程中的稳定性。为了证明提出方法的有效性,我们在Multi-PIE,BU-3DFE和SFEW三个不同的数据集上进行大量的实验,并与目前先进的人脸表情识别算法进行比较。实验结果表明,相比较于现有的人脸表情识别方法,我们的模型不仅能够通过生成不同姿态和表情的人脸图像扩大训练集,提高识别准确度,而且模型在训练过程中更加稳定,并且在具有极端姿态和面部遮挡的情况下也取得了较好的效果。
其他文献
随着现代无线通信的发展以及人们对通信质量要求的不断提高,小型化、高性能、低成本的微波多工器受到研究者越来越多的关注。微波多工器是将多个滤波器利用一定的匹配网络连接起来,因此它不仅具有单个微波滤波器的良好性能,而且还能够用作隔离元器件连接接收与发射系统。为了适应软件无线电技术对可重构射频前端的需求,对于多工器可重构化的研究也日益重要。本文主要的研究工作如下:第一部分是基于阶梯阻抗谐振器的星点馈电结构
压气机是燃气轮机研制的核心之一,压气机导叶可调可以增加喘振裕度、提高非设计工况效率、改善燃机的起动和加速性,因而深入探究和研究压气机导叶调节规律具有理论和应用上的双重价值。本文主要通过数值模拟和实验两种方法以2.5级跨音速轴流压气机为研究对象,在0.6n工况不同背压下的可转导叶调节规律进行研究,同时对3种导叶安装角的内部流场进行数值模拟计算和实验测量。由于压气机内部流动本质是三维、黏性、非定常的,
细胞壁是植物、细菌、真菌细胞膜外的一层具有弹性的多糖聚合物为主要骨架的结构物质,对于维持细胞形态、抵御外界理化胁迫、调控细胞生长具有重要作用。目前,关于细胞壁主要组成成分及相对含量研究方法的建立已经相对成熟,原子力显微镜、透射电镜、场发射扫描电镜等高分辨显微成像技术对于细胞壁超微结构的解析起到重要的先导作用。然而,这些方法不适用于在活体水平揭示细胞壁原始结构。本研究着眼于利用光学显微镜可对活细胞进
无线传感器网络(Wireless Sensor Networks,WSN)在众多领域有着广泛的应用,但由于其受到带宽限制、有限电池电量和动态拓扑等特性的影响易受到一系列安全攻击,尤其是虫洞攻击。虫洞攻击者通过对不在彼此通信范围内的节点建立伪造邻居关系并由此破坏网络功能。如何对虫洞攻击进行有效的安全检测并删除网络中的伪造邻居关系是无线传感器网络应用过程中亟需解决的问题。针对上述问题,本文提出一种基于
随着电子商务的发展,客户留言的价值逐步突显。从结构化、半结构的文本数据中获取高质量相关建议信息,呈现不可估量的商业发展前景。建议识别是自然语言处理中文本分类的一个应用场景,旨在利用自然语言处理技术,挖掘客户留言构成的自然文本,从而准确识别出哪些文本具有建议的属性,让商家聚焦这些建议内容,改进服务质量。本文从深度学习技术入手,探究如何建立有效的识别模型,如何利用文本蕴含的特征来增强建议识别模型的准确
二维金属硫族化合物具有新颖的电、光、磁、热特性,在超薄、透明、高集成度的光电子器件领域具有巨大的应用潜力。在二维材料及相关器件的研发中,探索新型的二维材料以及对其性质的探究是非常重要的研究方向,在此基础上开发新型器件将促进二维材料的实际应用。本文系统的研究了二维SnS与SnS2的生长工艺参数对材料光电性能的影响,主要研究结果分为以下两大部分:SnS是一种高度各向异性的硫族化合物,在偏振检测方面具有
随着能源的枯竭和环保意识的深入,人们逐渐意识到可持续发展的重要性。而水液压技术正符合人们的期望,在有望取代传统液压技术的道路上不断进步。但是由于水液压介质来源广泛,难免存在各种杂质颗粒,这将对水液压阀造成冲蚀磨损,严重影响到液压系统的稳定性和安全性。因此,本文针对水液压技术中的冲蚀磨损现象进行研究分析,分别从能量吸收、耐冲蚀材料和表面仿生结构三个方面对阀芯结构进行改进,运用仿真软件和冲蚀实验分析阀
教学风格是教师在长期教学过程中所表现出的个性化教学方法,学业自我效能感是个体在学习过程中对自身是否有能力实现目标的自信程度。在教学实践中,“如何教”比“教什么”更重要,教师的教学风格对学生的学业自我效能感与个性发展有重大影响。然而,当前对于教学风格与学生学业自我效能感的关系的研究多以高校师生为研究对象,而且多为理论研究。因此,探索初中英语教师教学风格与学生学业自我效能感的关系的实证研究具有重要意义
近年来,伴随着人工智能(Artificial Intelligence,AI)、物联网等领域的兴起,使得大数据的应用需求急剧增加,从而对存储器件的记录密度有了更高的要求。因为传统存储技术记录密度已经到达了物理极限,基于通过电子自旋相干操作进行调控的自旋电子器件开始逐步发展,这些器件不仅可以解决高功耗的问题,还可以突破目前速度和集成度的瓶颈。目前在自旋器件中最具优势的是具有读写速度快、功耗低且数据不
2007年《社会蓝皮书:中国社会形势分析与预测》表明,列于中国首位的社会问题就是“看病难、看病贵”。近十年来,我国人均医疗卫生费用的增长幅度早已超过人均国内生产总值的增长幅度。在既定的医疗保障体系下,百姓对于“看病难、看病贵”的呼声越来越高。D市也并不例外,就现有D市市级医院数据深入分析,医院收入药占比平均高达近35%,由此可见,患者医疗总费用趋高这种现实情况很大程度上源于药品利润较高,即医院收入