轻量化卷积神经网络研究与应用

来源 :广西师范大学 | 被引量 : 11次 | 上传用户：jeffyi2009

【摘要】

：

【作者】

：

周悦

【出处】

：

广西师范大学

【发表日期】

：

2019年01期

【关键词】

：

卷积神经网络轻量化特征提取网络性能表情识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机软硬件飞速发展和大数据时代的到来,深度学习已经成为当前的研究热点,并已经广泛应用在生活中的各个领域,例如人脸识别、生物医学图像识别、公安刑侦、智能驾驶等领域。卷积神经网络(Convolutional Neural Network)作为目前广泛使用的深度学习算法之一,经过不断的发展,在大规模数据集上图像识别的准确率已经超过了人类平均水平,已成为图像识别领域最顶尖的算法。CNN在训练时无需人为的提取图像特征,可直接将图片输入网络,实现端到端的训练与预测,避免了传统识别算法复杂的图像预处理过程。CNN采用卷积核提取图像特征,该结构是一个多层感知器,可以在图像中提取到更加详细的图像特征信息,且对位移,比例缩放,倾斜等变形形式依然具有高度的不变性。本文从卷积神经网络理论出发,旨在设计轻量化高识别率的卷积神经网络,并将其应用在表情识别中。通过研究经典的卷积神经网络结构,并进行网络训练调参与网络优化得到了参数较少、识别率提升的网络训练模型,最终利用模型构建表情识别系统。本文主要研究内容包括以下几个方面:(1)通过对经典的AlexNet轻量化二级改进,对比改进前后的模型在数据集上的表现,验证模型轻量化的同时提高识别准确率的可行性。改进网络使用并行的多尺度卷积核对特征图片进行特征提取,采样的过程中保持输出维度一致,然后采用级联的方式将输出的特征图整合在一起。采用多种卷积核采样可以增加采集到特征的多样性。改进网络中使用了大量的1×1卷积核减少特征图厚度,有利于模型参数减少。改进后的网络在Caltech256和101_food数据集上进行测试,实验结果表明改进网络在原网络的基础上模型规模降低,识别率提高。(2)为了设计轻量型卷积神经网络,本文设计了轻量化网络SliceNet,SliceNet在提取特征时先将输出特征图分成数量相等的两组,每一组采用不同的卷积核进行操作以提取更充分的信息,而后将分组得到的多样性特征图像进行级联,最后通过1×1的卷积核将所有特征图整合作为下一层的输入。利用SliceNet与传统的CNN比较在Caltech256和101_food数据集上的分类精度来对比网络性能。SliceNet在数据集Caltech256上将识别率由50.1%提升至52.2%,在数据集101_food上将识别精度由66.3%提升至68.9%。(3)基于SliceNet提出了一种轻量化的高识别率的网络模型ReduceNet。ReduceNet使用Reduce模块对卷积神经网络进行轻量化处理。该轻量化网络在模型规模大幅度降低的情况下,仍具有较好的识别优势。基于Reduce模块,提出了加入残差思想的改进网络模块ReduceV2。使用ReduceV2模块设计了轻量化网络ReduceV2Net。ReduceV2Net在识别精度方面具有更强的性能。(4)为了将轻量化网络运用在人脸表情识别中,利用深度学习框架Caffe在人脸表情数据集上训练,得到人脸表情识别网络模型,并将识模型应用在视频中实时的人脸表情识别。对网络模型进行集成得到人脸表情识别性能更好的集成模型,并将其运用在图像中的人脸及表情识别中。

其他文献

清廷毁书的罪证——论河南省图书馆馆藏四库全书《日知录》《明文海》抽毁本的价值

本文对河南省图书馆珍藏的四库全书<日知录>、<明文海>抽毁本多角度论证其学术价值和版本价值,可供研究中国图书史、四库全书编修史和清廷禁书、毁书史的学者参考.

期刊

清廷毁书立论

长城葡萄酒携手经销商探讨掘金之路

<正>当前国产葡萄酒领域正迎来重要的发展期,"白染红"成为行业高频词汇。在"红金时代"的新赛道上如何实现弯道超车,成为经销商伙伴们的一道重大选择题。6月28日,由中粮长城酒

期刊

长城葡萄酒经销商酒业协会

新媒体时代下电视台编辑创新能力的现状及提高策略

信息技术及互联网的创新,推动了新媒体的快速发展和崛起,对电视台的发展造成了巨大的冲击。电视台也必须加强创新,才能适应时代发展的要求,因此,这就迫切要求作为电视台发展

期刊

新媒体电视台编辑创新能力编辑创新能力

井下液面监测技术在龙凤山气田的应用

针对龙凤山特低渗凝析气藏低压气井作业时压井液漏失严重、容易造成储层污染导致产能下降的问题，在作业过程中进行环空带压力实时监测，及时准确掌握井下液面变化情况，计算地层压

期刊

低压气井压井液面监测应用

大环多胺配体及其配合物的合成、表征和晶体结构的研究

本论文的主要工作如下：1、以对羟基苯甲醛和1,2-二氯乙烷,二乙烯三胺为原料,通过取代、环化和还原三步反应合成冠醚配体,1,4,23,26,29,48-六氮杂-6,9：16,19：31,34：41,44-四苯基-1

学位

大环多胺合成配合物超分子晶体结构

蒽醌及其衍生物的理论化学研究

蒽醌（AQ）及其衍生物不仅是一类重要的染料,也是很多药物的成分,在其它领域也有广泛的应用。本文借助量子化学中的密度泛函理论（DFT）和含时密度泛函理论（TD-DFT）方法,对蒽醌类化合物

学位

蒽醌密度泛函理论含时密度泛函理论分子动力学分子结构红外光谱紫外光谱分子内氢键分子内质子转移热力学性质吸附

以{SbW9}为结构基元的三明治型化合物的合成、结构及性质研究

利用溶液法，通过控制投料方式、调节pH值等条件合成了5种结构新颖的夹心型化合物，通过元素组成分析和TG分析确定其化学式为：[{Na2（H2O）4（OH）2}{Na（H2O）4}2{（Zn（H2O）3）2（W（H2O）2）2(SbW9O33)2}]

学位

{SbW9}多金属氧酸盐夹心型结构电化学性质磁学性质荧光性质

活性Al2O3负载Er3+-N-TiO2/Er3+-F-TiO2纳米光催化剂的制备及可见光下流动床降解苯酚的研究

本文以活性Al2O3为载体，采用水热法制备了新型活性Al2O3负载Er3+-N-TiO2/Er3+-F-TiO2纳米光催化剂。在可见光下，在流动体系中对苯酚进行降解。将二氧化钛固化到活性Al2O3上，可减

学位

负载流动床可见光下光催化Er3+-N-TiO2Er3+-F-TiO2

PMS2.0系统健康度模型及对策分析

针对复杂计算环境下运维监控需求,提出业务系统健康度模型,该模型建立业务系统从微观层面(多元化的、细粒度的监测指标)到宏观层面的"健康度"评测方法体系和过程,为企业稳定

会议

业务系统健康度监控云计算运维监控网元

突出运算能力的实数复习课设计与反思

基础复习教学,要重视运算能力的培养。《义务教育数学课程标准》(2011年版)(以下简称《课标》(2011年版))明确指出:运算能力主要是指能够根据法则和运算律正确地进行运算的能

期刊

平方根复习课无理数导学稿相反数有理数

轻量化卷积神经网络研究与应用

其他学术论文