深度神经网络模型压缩算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xuzhidanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受深度神经网络发展的推动,近年来学术界和工业界掀起了新一波人工智能浪潮。凭借强大的特征提取能力,深度神经网络已经在图像和语音识别,自然语言处理等领域完全超越传统的机器学习算法。神经网络如此卓越的性能,主要得益于其复杂的网络结构和海量的训练数据,伴随而来的是网络模型庞大的参数量和计算量,这导致模型向移动端等低配置平台的部署受到了限制。但实际上神经网络中很大部分参数是冗余的,于是一个很自然的想法就是在尽量保持网络性能的基础上对其进行压缩和加速。基于这个背景,本文重点针对深度卷积神经网络的压缩和加速算法展开研究,主要贡献如下:针对基于知识迁移的压缩方法,本文通过分析卷积层特征提取过程的特点,提出了基于特征图实例归一化统计量的迁移知识。通过可视化实验的方式,我们验证了这种统计量携带与样本类别相关的判别信息,可将其用于“老师-学生”网络训练框架中。相比现有方法对“知识”的定义,基于实例归一化统计量的迁移知识可以进一步提升学生网络的分类准确率,从而在已有的性能需求下,我们可以设计更加轻量的网络并提升其性能,等价地获得更高的压缩加速比。然而上述的迁移知识定义与现有的大多方法一样,没有考虑不同特征图之间的相关性,本文通过类比真实教学场景中老师向学生传授知识的过程,提出了一种基于特征图协方差矩阵的交互知识,让学生网络模拟结合多种知识向老师网络学习的过程。通过对比实验证明,基于特征图协方差矩阵的交互知识同样能够获得比现有方法更好的效果,也进一步加快了训练收敛的速度。本文还提出了一种基于知识迁移的通道自选择软剪枝算法。在已有软剪枝算法的基础上,我们对卷积层的每一个通道引入受稀疏约束的可学习权重掩码,并让被剪枝网络在老师网络的指导下,实现在训练过程中基于全局学习率和权重掩码自动选择不重要的通道进行结构化剪枝。通过在多个网络模型和数据集上的实验表明,本文提出的方法能以更小的精度损失对网络进行剪枝,从而获得更好的压缩和加速效果。
其他文献
目的建立血管性痴呆(VD)动物模型,观察其脑血流、行为学及脑组织形态学变化,初步了解VD的病理生理过程,探讨磁共振灌注成像(PWI)在测定VD脑血流中的价值。材料与方法采用永久性结
目的:探讨面部注射美容术患者的有效手术护理方法,观察其护理效果.方法:选取我院201 3年1月~2014年1月60例面部注射美容患者为研究对象,采用抽签法将患者随机分为观察组与对照组
目的:探讨中老年退变性腰椎滑脱CT表现特点。方法:选取经CT及临床证实的腰椎滑脱230例,扫描运用横断扫描加螺旋扫描,对腰椎滑脱的类型、节段、程度及相应椎间盘、小关节、椎
采用纯化的酵母菌和木醋酸菌菌株培养红茶菌液,利用高效毛细管电泳法(HPCE)测定培养液中I)I葡萄糖二酸-1,4-内酯(DsL)的含量,考察不同配方对DSL产量的影响。用HPCE法在培养10d的红茶
低温限制作物的种植区域,降低作物产量,是影响植物生长发育的重要环境因子。对低温下植物冷响应信号通路调控植物生长发育和低温抗性的研究,以及通过基因工程手段在保证植物
农村合作运动是国民党政权定鼎南京后极力推行的一项国家社会经济政策。抗战前,江苏省率先进行农村合作运动,并为之设立了农村合作事业指导委员会与金融部门江苏省农民银行;出台
英美文学是世界文学史中的重要组成部分,其具有着自身鲜明的文学内涵以及文学价值,在一些高校中也是对英美文学进行了不断的教学研究。在生态语言学视域下,对高校英美文学的
作为语言教学的重要组成部分,阅读对提高学生的语言综合能力起着非常重要的作用。近年来,阅读教学中仅注重语言知识的讲授和阅读技能的培养,却忽视对学生兴趣的培养,导致学生缺乏
在当今社会经济迅速发展的时代背景下,石油以及天然气能源在我国的应用范围越来越广,石油化工建设工程日益增加,为推动石油化工产业的进步做出了重要的贡献。对于石油化工企
<正>创造与共享社会价值,正是当下企业的使命。在2019《商学院》商业领袖高峰论坛暨第三届寻找中国最具价值企业颁奖典礼隆重开启之际,中国社会科学院学部委员、《商学院》杂