基于深度学习的人脸表情识别算法研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:DeadManWalk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类识别目前在深度学习领域占据着重要地位,表情能够反映人类心理变化,精准的识别人脸表情是目前极具挑战的项目。为了能够更加准确的识别人脸表情,研究者们提出了许多方法,这些方法大都通过训练网络模型以达到识别目的,现存的网络模型往往提取的图像特征单一并且多采用浅层网络结构,导致识别精度仍需提高。本文依托国家重点研发计划(编号:2019YFE0108300)和国家自然科学基金(编号:61302150),从网络结构以及减少参数,避免过拟合现象等方面出发,提出了新的网络模型。论文的主要研究内容如下:(1)本文对残差网络Res Net算法进行深入研究,其引入恒等映射概念很大程度上解决了深层网络所带来的性能退化问题,但在图像特征提取时未考虑到尺度特征,针对这一问题提出深度多尺度融合残差网络(Deep Multi-scale Fusion Residual Network,DMSF-Res Net)。网络模型的特征提取主要由残差模块完成,残差模块由若干个多尺度残差学习单元组成,包括2条含有卷积层的支路以及1条恒等映射支路,对输入图像进行并行多卷积操作以获得多尺度图像特征;训练过程中参数过多往往会影响网络模型性能,因此在各个残差块之间设计过渡层对图像特征信息进行压缩,去除冗余信息并减少参数计算量;采用Global average pooling+Dropout的设计,降低网络训练过程中的空间参数,抗过拟合的效果更佳。(2)不同区域的特征信息在重要程度上有着很大的差异性,图像遮挡会导致识别率大幅度下降,本文提出一种深度多尺度融合注意力残差网络(Deep Multi-scale Fusion Attention Residual Network,DMFA-Res Net),该网络模型算法主要提出注意力残差模块和多尺度融合模块。在多尺度残差学习单元中加入注意力机制,能够增强网络对重点区域的特征提取并减少冗余背景信息的干扰,更加有利于遮挡图像特征的学习。多尺度融合模块将各个注意力残差模块的输出进行特征融合,丰富网络获得的表情信息,该网络模型算法能够有效识别遮挡人脸表情图像。在实验阶段,对CK+和JAFFE数据集通过数据增强的方法进行改善,由于没有公开的遮挡表情数据集,因此对图像进行遮挡操作。经过实验验证,本文所提出的两种算法分别针对非遮挡以及遮挡人脸表情识别均获得了较高的识别率,证明了算法的有效性。
其他文献
随着数字地球与智慧城市的飞速发展,城市空间数据受到各行各业的广泛关注,如何对海量城市数据进行整合与分析是目前建立智慧城市的研究重点。城市三维模型具有较高的场景还原度和三维可视化性质,构建城市三维模型和对三维模型的管理利用对于智慧城市的建设具有很高的应用价值。传统的手工建模方式已经不适用于构建大规模的城市模型,倾斜摄影测量已成为智慧城市中三维地理空间信息获取的重要手段,计算机技术的高速发展以及三维技