论文部分内容阅读
随着计算机软硬件飞速发展和大数据时代的到来,深度学习已经成为当前的研究热点,并已经广泛应用在生活中的各个领域,例如人脸识别、生物医学图像识别、公安刑侦、智能驾驶等领域。卷积神经网络(Convolutional Neural Network)作为目前广泛使用的深度学习算法之一,经过不断的发展,在大规模数据集上图像识别的准确率已经超过了人类平均水平,已成为图像识别领域最顶尖的算法。CNN在训练时无需人为的提取图像特征,可直接将图片输入网络,实现端到端的训练与预测,避免了传统识别算法复杂的图像预处理过程。CNN采用卷积核提取图像特征,该结构是一个多层感知器,可以在图像中提取到更加详细的图像特征信息,且对位移,比例缩放,倾斜等变形形式依然具有高度的不变性。本文从卷积神经网络理论出发,旨在设计轻量化高识别率的卷积神经网络,并将其应用在表情识别中。通过研究经典的卷积神经网络结构,并进行网络训练调参与网络优化得到了参数较少、识别率提升的网络训练模型,最终利用模型构建表情识别系统。本文主要研究内容包括以下几个方面:(1)通过对经典的AlexNet轻量化二级改进,对比改进前后的模型在数据集上的表现,验证模型轻量化的同时提高识别准确率的可行性。改进网络使用并行的多尺度卷积核对特征图片进行特征提取,采样的过程中保持输出维度一致,然后采用级联的方式将输出的特征图整合在一起。采用多种卷积核采样可以增加采集到特征的多样性。改进网络中使用了大量的1×1卷积核减少特征图厚度,有利于模型参数减少。改进后的网络在Caltech256和101_food数据集上进行测试,实验结果表明改进网络在原网络的基础上模型规模降低,识别率提高。(2)为了设计轻量型卷积神经网络,本文设计了轻量化网络SliceNet,SliceNet在提取特征时先将输出特征图分成数量相等的两组,每一组采用不同的卷积核进行操作以提取更充分的信息,而后将分组得到的多样性特征图像进行级联,最后通过1×1的卷积核将所有特征图整合作为下一层的输入。利用SliceNet与传统的CNN比较在Caltech256和101_food数据集上的分类精度来对比网络性能。SliceNet在数据集Caltech256上将识别率由50.1%提升至52.2%,在数据集101_food上将识别精度由66.3%提升至68.9%。(3)基于SliceNet提出了一种轻量化的高识别率的网络模型ReduceNet。ReduceNet使用Reduce模块对卷积神经网络进行轻量化处理。该轻量化网络在模型规模大幅度降低的情况下,仍具有较好的识别优势。基于Reduce模块,提出了加入残差思想的改进网络模块ReduceV2。使用ReduceV2模块设计了轻量化网络ReduceV2Net。ReduceV2Net在识别精度方面具有更强的性能。(4)为了将轻量化网络运用在人脸表情识别中,利用深度学习框架Caffe在人脸表情数据集上训练,得到人脸表情识别网络模型,并将识模型应用在视频中实时的人脸表情识别。对网络模型进行集成得到人脸表情识别性能更好的集成模型,并将其运用在图像中的人脸及表情识别中。