基于三通道三维卷积神经网络的近红外人脸表情识别

来源 :西南大学 | 被引量 : 0次 | 上传用户:liwenwu042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别在许多领域已得到广泛应用,例如:人机交互、生物学、安防等领域。近几年在深度学习的助力下,人脸表情识别的识别率更是显著提升。就目前人脸表情数据集而言,大多在可见光谱下采集,表情识别率受光照变化影响较大。同时,多数表情识别的数据集均采用静态单帧图像,然而人脸表情变化是动态过程,基于图像序列的研究相对于单帧图像更符合表情产生的本质特性。针对以上问题,我们提出了基于三通道三维卷积神经网络的近红外人脸表情识别,本文工作如下:(1)采用了三维卷积神经网络进行近红外人脸表情识别。该网络自动提取近红外图像序列的时空特征,有效的利用了人脸表情的动态信息。尽管,三维卷积神经网络已经在之前被提出,但是我们首次探索三维卷积神经网络在近红外人脸表情识别中的应用。(2)设计了三通道三维卷积神经网络NIRExpNet。NIRExpNet包含两个子网络:全局网络(Global Network)提取整体人脸的全局特征,局部网络(Local Network)提取部分人脸(人脸的上半部分和下半部分)的局部特征。(3)通过实验进行NIRExpNet网络的微调。为了避免过拟合现象的出现,通过实验设计了一个中型的卷积神经网络结构。全局网络采用VGG-M-2048网络结构,局部网络采用两个卷积层的浅层网络结构。并且,最终选取级联(Concatenation)融合方式进行三通道的卷积神经网络融合,使得整个NIRExpNet网络可以更好的融合全局和局部特征以及最终达到最优的状态。本文采用Oulu-CASIA近红外人脸表情数据库测试。实验结果显示,NIRExpNet获得78.42%的识别率,超越了其他对比算法(LBP-TOP(72.33%)、3D HOG(60.00%)、3D CNN DAP(72.12%)、DTAGN(66.67%)),证明了本文提出算法的有效性。
其他文献
光纤陀螺惯性导航系统以高精度、低功耗、高可靠性的优势越来越多地被应用于空间卫星的姿态控制中,光纤陀螺应用在空间中其误差会受到辐射效应的影响,进而使光纤陀螺的性能发
近些年来,数字信息呈喷薄式地增长发展,逐渐被广泛地应用到科技发展的各个领域当中。数字彩色图像由于具有特殊的颜色、纹理和形状等特点,从而成为了多媒体数字信息中应用最
随着大数据与人工智能时代的到来,数据与智能在我们的生活与工作中扮演着举足轻重角色。数据挖掘作为大数据与人工智能应用最为广泛的一条技术分支,其中的数据挖掘算法的性能
大数据时代到来,数据规模的快速增长和应用的高时效处理需求对处理器结构和并行计算机系统结构提出了新的巨大挑战。图搜索问题是大数据研究的热点问题,被广泛应用于科学研究
重识别技术旨在从不同的拍摄场景中识别出相同的目标,是智慧城市以及智能视频监控研究领域的重要分支。视频监控中车辆重识别是重识别技术需要解决的问题之一,其中通过车辆的
语言是我们最重要的交流工具,而词语是语言的建筑材料、载体,词语教学又是组成小学语文教学的重要部分之一,所以我们要对词语教学重视起来。词语教学作为学生进行阅读、口语交际、写作等活动的基石,在小学语文当中所占的位置是非常重要的,对学生语文素养的提高以及听、说、读、写等各个方面能力的培养和发展都有着至关重要的影响,尤其是对于低年级的小学生来讲,建好这座基础的桥梁显得格外重要。然而当前的词语教学中还存在着
学位
伴随生物信息科学在近些年来的飞速发展,生物特征识别技术迅速融入到当今人类社会活动的方方面面。当今常用的生物信息包括,掌纹、指纹、虹膜、人脸、步态等。其中,人脸信息
复杂场景下的音频序列切分是对音频做深度处理的基础和前提,对音频后续处理工作具有重要的影响。在许多实际应用的场景中,如语音识别系统、说话人识别系统和语音自动标注系统
目的:通过观察宝如剂对溃疡性结肠炎相关性结肠癌(UCACC)模型小鼠的预防作用,验证蒙药宝如剂对溃疡性结肠炎相关性结肠癌的防治作用,为蒙医药防治UCACC临床提供可参考的实验数据。方法:将144只SPF级BALB/c雄性小鼠随机分为空白对照组、宝如剂低剂量组、宝如剂中剂量组、宝如剂高剂量组、西药组(美沙拉嗪)、模型组6组。空白对照组除外,其余各组通过联合应用氧化偶氮甲烷(AOM)与三个循环的葡聚糖
传统的机器学习技术依赖于大量有标记样本进行训练,但是在实际应用中大量的有标记样本获取困难,相比之下,无标记样本廉价、容易获取。因此,只需要少量的有标记样本和充分利用