基于变分剪枝的卷积神经网络压缩算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lawyerhw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在大数据与高性能计算平台的支撑下,深度卷积神经网络因其对于图像数据的强大非线性拟合能力、高度特征抽象能力和自动特征表达能力而在各类计算机视觉任务中取得了卓越性能。然而其在性能提升的同时也产生了繁重的计算开销、巨大的内存消耗以及超量的存储占用,进而限制了其向资源受限终端的部署,以及在时间敏感的实际场景中的应用。基于此,本文聚焦于基于变分贝叶斯的网络剪枝技术,深入研究变分贝叶斯理论在卷积神经网络剪枝技术上的效用。本文主要工作如下:1.针对传统的网络剪枝算法忽略参数的波动性和随机性的问题,提出了一种基于变分贝叶斯的稀疏学习剪枝算法。所提算法首先设计了乘性噪声层,并以其为关键参数进行先后验分布设计与变分推理,构造具有稀疏先验的贝叶斯模型,然后利用稀疏先验分布诱导关键参数进行不同细粒度的稀疏学习与迭代软剪枝操作,最后通过微调获得最终轻量化模型。所设计算法通过具有稀疏先验的贝叶斯模型的构建,一方面诱导参数向稀疏化方向靠拢,以实现更高性能的压缩,另一方面增加了参数的随机性,使得剪枝算法更具鲁棒性。在LeNet-300-100、LeNet-5和VGGNet上,所提算法在参数细粒度剪枝以及滤波器细粒度剪枝上取得了优越的压缩与加速性能。2.针对传统网络自动搜索剪枝算法的搜索域庞大而导致搜索过程耗时耗力的问题,提出了一种基于变分贝叶斯的自动结构优化剪枝算法,利用变分贝叶斯与随机梯度变分贝叶斯的采样与优化特性,将搜索问题转化为优化问题,设计自动结构优化算法以寻找最优的网络剪枝结构,实现自动高效的模型压缩。算法首先构建了变分结构自动优化网络,并以通道尺度为变分变量构建了贝叶斯模型,之后在变分结构自动优化网络中对通道尺度进行变分优化,获得了通道尺度的近似后验分布,最后基于所获得的的分布可以构建网络最优剪枝模型,通过进一步的剪枝与微调操作,最终实现网络的轻量化。所设计算法一方面通过设计自动优化网络实现通道剪枝,避免了繁琐的超参数调整和经验设计,另一方面贝叶斯技术的引入进一步提升了模型的稳定性与可解释性。所设计算法在LeNet-5、VGGNet和ResNets系列网络中与其他方法相比取得了更优的压缩与加速性能,证实了所设计算法的有效性。
其他文献
稀疏贝叶斯学习(Sparse Bayesian Learning,SBL)算法是一种基于贝叶斯理论的稀疏重构算法,在阵列信号处理、频谱感知、雷达定位、图像处理等领域中得到了广泛的应用。传统稀疏贝叶斯学习算法假设噪声服从高斯分布,但是在一些实际应用环境中,存在多种复杂环境噪声,此时传统的概率假设无法提供准确的先验信息,针对这一问题进行改进,可提高稀疏贝叶斯算法在复杂环境下的性能。本文从环境噪声模型的
高动态范围(High Dynamic Range,HDR)图像拥有丰富的色彩和细节信息,能够更真实地表现实际场景,但使用硬件直接捕获HDR图像的方法成本昂贵,难以普及,现阶段大多采用软件算法获取,主要包括多曝光HDR图像获取方法与单曝光HDR图像获取方法。多曝光方法需要处理图像中前景移动所带来的鬼影效应,并进行多帧对齐,而单曝光方法则可以直接避免此类问题。本论文主要研究基于深度学习的单曝光HDR图
视觉目标跟踪分为短时跟踪和长时跟踪。短时跟踪对应的视频时长约在几十秒左右,主要解决跟踪过程中的亮度变化、尺度变化、旋转、运动模糊等对被跟踪目标的干扰。与短时跟踪方法相对成熟稳定不同,长时跟踪中由于视频序列更长,存在的目标变化、遮挡和消失情况较多,常规的短时跟踪网络和算法性能急剧衰减,因此开展长时跟踪方法研究,对解决实际应用具有重要的研究意义。另外,以深度学习为基础的长时跟踪研究近几年刚起步,数据集
在互联网时代,头像在社交平台上起着名片的作用。部分人选择将个性突出的卡通画像作为自己的头像,但是让计算机自动生成符合人类主观审美的卡通头像不是一件容易的事情。生成对抗网络(Generative Adversarial Networks,GANs)作为现阶段主流的生成模型,在图像生成领域做出了巨大贡献,基于GANs的卡通头像生成技术受到了国内外学者的广泛关注。然而,现有的基于GANs的卡通头像自动生
人类视觉系统能够有效快速地找到图像或视频中感兴趣的区域进行处理,忽略无用的信息,但是传统计算机却没有这种能力。在计算机视觉领域中,显著对象检测旨在于让计算机具有和人一样的视觉处理能力,使计算机能够关注场景中的显著对象而忽略背景信息,从而快速处理大量图像,因此显著对象检测成为许多计算机视觉任务的预处理步骤。显著对象谱的好坏,直接影响到其后视觉任务的性能效果,因此提高显著对象检测能力十分重要。本文针对
人体解析是对人体图像中的部位和衣物进行像素级别的识别。基于强有力的语义分割方法并进一步结合有关人体特性的辅助信息是当前的人体解析工作的主要研究路线。我们注意到,当人们在社交网站上分享照片时,往往会分享身着同一套衣服以不同姿势或角度拍摄的多张照片。这些额外的照片天然地可以作为人体解析任务的辅助信息。本文受到这种行为的启发,当对一张人体图像进行解析时,可以提供另一张相关图像的原图作为参考图像,通过寻找
随着我国信息化建设的推进,网络基础设施的不断完善和各种网络应用的普及给我们的生活带来诸多便利的同时,企图对网络进行入侵或破坏的各种网络异常行为也在不断增加。网络异常行为检测有利于及时地对异常情况进行预警和响应,避免或降低异常行为所带来的损失。如何对网络异常行为进行有效检测已成为网络安全领域的重要研究课题。网络行为通常以包和流作为数据载体,近年来基于包的网络异常行为检测和基于流的网络异常行为检测是两
多目标跟踪是计算机视觉中的一个重要研究方向,其在学术研究和实际应用中都有重大的意义。在安防系统、自动驾驶、人机交互等方面有很高的应用价值。现在最常用的多目标跟踪框架是基于检测的多跟踪,其主要是结合检测器提供的检测结果来设计一套有效的关联度量和关联算法,从而将这些检测结果匹配起来,完成多目标跟踪任务。本文主要针对多目标跟踪中的运动建模和外观建模两个方面展开研究,并且结合实际应用分析多目标跟踪中存在的
柔性可穿戴传感器凭借柔性、可形变的特性而备受关注,柔性器件可以广泛应用于人体健康监测、机器人智能传感、人机交互、医疗康复等诸多领域,具有很好的发展前景。基于传统集成电路的柔性器件制备工艺已经发展成熟,但是由于其较高的制备成本以及对材料的要求严格等问题,限制了该工艺在制备柔性器件领域的应用。目前已经发展了多种新型柔性器件制备工艺,如丝网印刷、掩模喷涂以及静电纺丝等工艺,具有制备流程简单、成本低以及易
视觉目标跟踪(Visual Target Tracking)是对图像序列中的运动目标进行检测、提取、识别和跟踪的一类技术,主要任务是为了获得运动目标的运动参数,从而实现对运动目标的行为理解,以完成更高一级的检测任务。目标跟踪算法在公共安防、工厂生产、交通管控等相关场景有着极为广泛的应用。对于视觉目标跟踪算法的研究在计算机视觉领域一直备受关注。尽管在像素域的相关算法研究已经取得了很大的进步,尤其在近