论文部分内容阅读
随着智能设备的普及,人机交互和机器视觉成为一个研究热点。机器视觉系统是指通过机图像摄取装置将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息。光电图像处理技术将自然界中的模拟图像信号转换为计算机中的数字图像,通过相关人工智能算法,使机器具有与人一样的视觉功能。人脸表情识别作为人机交互的一个重要接口,有着极高的应用价值和前景。如今,基于深度学习的图像识别技术发展迅速,特别是卷积网络已经成为图像识别的主流网络架构。本文主要研究在人脸表情识别中网络规模、网络结构以及识别率之间的关系,并提出了改进方案。研究轻量级神经网络模型在表情分类领域的效果,在降低模型复杂度的情况下保持识别率微弱下降。使用表情标签分布的方法解决复合表情的问题。最后设计与实现了表情识别分析系统,并在嵌入式平台进行部署,结果表明基于深度学习的表情识别算法可以在小型设备上达到实时的效果,为深度学习算法能够在现实场景下部署迈出关键一步。本文的主要工作如下:1.为了使本文设计的网络模型在复杂场景下具有很好的实用性,选择FER2013表情识别库作为实验数据集。首先对浅层网络模型AlexNet和深层网络模型VGGNet进行分析研究,为了解决这两个模型不能同时兼顾模型规模和识别性能的问题,设计了一种轻量级网络模型,使模型规模减小的同时保证识别率不损失。加入模型规模调控因子,对网络规模和识别性能之间的均衡化进行了探究。为解决人脸同时出现多种表情的问题,使用基于标签分布的学习方法,相比较常规单表情数据集方法,识别率大幅提高。2.对上述模型进行实验分析,以本文设计的轻量级模型为基础,设计了一个简易的表情识别分析系统,包含有图像显示、人脸探测、预测类别、特征可视化等功能模块。最后将模型移植到嵌入式平台上,对VGGNet和轻量级网络在嵌入式平台上的实时识别速度进行了对比。实验表明提出的轻量级模型达到实时性的基本要求。