轻量化卷积神经网络研究与应用

来源 :广西师范大学 | 被引量 : 11次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软硬件飞速发展和大数据时代的到来,深度学习已经成为当前的研究热点,并已经广泛应用在生活中的各个领域,例如人脸识别、生物医学图像识别、公安刑侦、智能驾驶等领域。卷积神经网络(Convolutional Neural Network)作为目前广泛使用的深度学习算法之一,经过不断的发展,在大规模数据集上图像识别的准确率已经超过了人类平均水平,已成为图像识别领域最顶尖的算法。CNN在训练时无需人为的提取图像特征,可直接将图片输入网络,实现端到端的训练与预测,避免了传统识别算法复杂的图像预处理过程。CNN采用卷积核提取图像特征,该结构是一个多层感知器,可以在图像中提取到更加详细的图像特征信息,且对位移,比例缩放,倾斜等变形形式依然具有高度的不变性。本文从卷积神经网络理论出发,旨在设计轻量化高识别率的卷积神经网络,并将其应用在表情识别中。通过研究经典的卷积神经网络结构,并进行网络训练调参与网络优化得到了参数较少、识别率提升的网络训练模型,最终利用模型构建表情识别系统。本文主要研究内容包括以下几个方面:(1)通过对经典的AlexNet轻量化二级改进,对比改进前后的模型在数据集上的表现,验证模型轻量化的同时提高识别准确率的可行性。改进网络使用并行的多尺度卷积核对特征图片进行特征提取,采样的过程中保持输出维度一致,然后采用级联的方式将输出的特征图整合在一起。采用多种卷积核采样可以增加采集到特征的多样性。改进网络中使用了大量的1×1卷积核减少特征图厚度,有利于模型参数减少。改进后的网络在Caltech256和101_food数据集上进行测试,实验结果表明改进网络在原网络的基础上模型规模降低,识别率提高。(2)为了设计轻量型卷积神经网络,本文设计了轻量化网络SliceNet,SliceNet在提取特征时先将输出特征图分成数量相等的两组,每一组采用不同的卷积核进行操作以提取更充分的信息,而后将分组得到的多样性特征图像进行级联,最后通过1×1的卷积核将所有特征图整合作为下一层的输入。利用SliceNet与传统的CNN比较在Caltech256和101_food数据集上的分类精度来对比网络性能。SliceNet在数据集Caltech256上将识别率由50.1%提升至52.2%,在数据集101_food上将识别精度由66.3%提升至68.9%。(3)基于SliceNet提出了一种轻量化的高识别率的网络模型ReduceNet。ReduceNet使用Reduce模块对卷积神经网络进行轻量化处理。该轻量化网络在模型规模大幅度降低的情况下,仍具有较好的识别优势。基于Reduce模块,提出了加入残差思想的改进网络模块ReduceV2。使用ReduceV2模块设计了轻量化网络ReduceV2Net。ReduceV2Net在识别精度方面具有更强的性能。(4)为了将轻量化网络运用在人脸表情识别中,利用深度学习框架Caffe在人脸表情数据集上训练,得到人脸表情识别网络模型,并将识模型应用在视频中实时的人脸表情识别。对网络模型进行集成得到人脸表情识别性能更好的集成模型,并将其运用在图像中的人脸及表情识别中。
其他文献
本文对河南省图书馆珍藏的四库全书<日知录>、<明文海>抽毁本多角度论证其学术价值和版本价值,可供研究中国图书史、四库全书编修史和清廷禁书、毁书史的学者参考.
<正>当前国产葡萄酒领域正迎来重要的发展期,"白染红"成为行业高频词汇。在"红金时代"的新赛道上如何实现弯道超车,成为经销商伙伴们的一道重大选择题。6月28日,由中粮长城酒
信息技术及互联网的创新,推动了新媒体的快速发展和崛起,对电视台的发展造成了巨大的冲击。电视台也必须加强创新,才能适应时代发展的要求,因此,这就迫切要求作为电视台发展
针对龙凤山特低渗凝析气藏低压气井作业时压井液漏失严重、容易造成储层污染导致产能下降的问题,在作业过程中进行环空带压力实时监测,及时准确掌握井下液面变化情况,计算地层压
本论文的主要工作如下:1、以对羟基苯甲醛和1,2-二氯乙烷,二乙烯三胺为原料,通过取代、环化和还原三步反应合成冠醚配体,1,4,23,26,29,48-六氮杂-6,9:16,19:31,34:41,44-四苯基-1
蒽醌(AQ)及其衍生物不仅是一类重要的染料,也是很多药物的成分,在其它领域也有广泛的应用。本文借助量子化学中的密度泛函理论(DFT)和含时密度泛函理论(TD-DFT)方法,对蒽醌类化合物
利用溶液法,通过控制投料方式、调节pH值等条件合成了5种结构新颖的夹心型化合物,通过元素组成分析和TG分析确定其化学式为:[{Na2(H2O)4(OH)2}{Na(H2O)4}2{(Zn(H2O)3)2(W(H2O)2)2(SbW9O33)2}]
本文以活性Al2O3为载体,采用水热法制备了新型活性Al2O3负载Er3+-N-TiO2/Er3+-F-TiO2纳米光催化剂。在可见光下,在流动体系中对苯酚进行降解。将二氧化钛固化到活性Al2O3上,可减
针对复杂计算环境下运维监控需求,提出业务系统健康度模型,该模型建立业务系统从微观层面(多元化的、细粒度的监测指标)到宏观层面的"健康度"评测方法体系和过程,为企业稳定
基础复习教学,要重视运算能力的培养。《义务教育数学课程标准》(2011年版)(以下简称《课标》(2011年版))明确指出:运算能力主要是指能够根据法则和运算律正确地进行运算的能