深度神经网络的模型压缩

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sjtygk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络在许多计算机视觉相关的任务中都取得了相当不错的成绩,但是随着解决的问题越来越复杂,现在的大多数神经网络模型都会需要较大的存储空间并且带来了高额的计算成本,这使得将网络部署在一些内存资源低和具有严格实时性要求的便携设备上变得困难。在过去的一段时间里,人们开始探索关于模型压缩和加速相关的问题,旨在不显著降低模型精度的情况下,能够大幅减少模型的参数量和计算量,使其能够部署在资源不足的设备上。在这样的背景条件下,本文对网络模型压缩进行了深入的研究,主要的工作内容如下:1.针对非结构性剪枝和结构性剪枝方法的不同,本文研究并实现了一种基于通道重要性的剪枝算法。在有关模型剪枝的算法中,一般都是对网络增加一些计算信息来评估卷积核或者特征图的重要性,用来判断我们需要保留或者舍弃的信息。而在本文中,通过网络BN层的缩放因子来作为特征图通道重要性的评价指标,选择不同的裁减比例来确定最优的剪枝阈值,把低于剪枝阈值的通道剪枝掉,而高于剪枝阈值的通道保留,由于特征图每个通道都是由卷积核通过卷积操作得到的,将通道对应的卷积核剪枝掉,得到压缩后的网络模型。本方法在VGG网络和SSD网络上进行了相关的实验,都在不显著降低模型精度的情况下,VGG网络取得了88.42%的剪枝率和1.94的加速比,而SSD网络也达到了76.67%的剪枝率。2.为了实现对网络的贝叶斯模型压缩,本文深入了解了相关的背景知识,从贝叶斯定理入手,将贝叶斯定理和神经网络相结合,体现出了贝叶斯定理对于实现模型压缩的重要性。由于引入贝叶斯的思想,就涉及到了后验概率的求解,而关于后验概率的求解往往是采用马尔科夫链蒙特卡罗方法(MCMC)和变分推断(VI)方法。MCMC与VI基于不同的思想来解决后验分布的求解问题,MCMC基于马尔科夫链采样来近似后验,而VI则是基于KL散度将问题转化为优化问题来近似后验。考虑到神经网络的训练本身就是优化问题,并且MCMC会存在计算困难,我们选择采用VI来计算后验分布。紧接着介绍了传统VI,由于神经网络参数不满足平均场理论,我们引入随机梯度变分推断,通过优化参数Φ求得最终的后验分布。3.针对网络参数的随机性和波动性,本文研究并实现了一种神经网络的贝叶斯模型压缩算法。首先在网络中引入了一个关键参数,为关键参数设计了特殊的稀疏先验分布并且通过变分推断引入后验分布,这样就构造好了贝叶斯网络模型。然后训练神经网络,由于先验和后验分布的特殊性,关键参数会逐渐偏向稀疏,最后通过可视化关键参数的分布来确定剪枝阈值对网络剪枝操作。贝叶斯模型压缩算法考虑到网络参数的随机性和波动性,使得压缩算法更具有鲁棒性。本方法在Le Net-300-100、Le Net-5、VGG和SSD网络上进行了实验,并且VGG网络取得了89.94%的剪枝率和2.52的加速比,和业内先进的压缩算法相比取得了最优的压缩效果。
其他文献
目的:分析阴道助产过程中,胎头吸引术和产钳助产术所起到的作用。方法:随机抽取2019年1月-2020年12月广饶县人民医院接收的90例产妇作为研究对象,分析其临床资料,采用随机数字表法分为对照组和试验组,各45例。对照组选用产钳助产术,试验组接受胎头吸引术。比较两组产妇的各项指标,包括助产成功率,软产道损伤情况,产后出血量,新生儿体重及不良反应(包括新生儿头皮血肿、颅内出血和窒息)。结果:试验组的
传统村落中,自建檐廊的出现表示着建筑居住空间的不足,透过自建檐廊甚至能窥见住户的无奈。自建檐廊,是一个代表冲突的符号。文章基于上海村落保护更新的背景,对葛隆村临街自建檐廊设施进行研究,梳理了自建瓦棚的特征及类型,结合实地情况,探讨了相应的解决办法,以使古村街道规范化,进而带动乡村活力。
<正>大连海关技术中心通过国际合作投标的方式将以往分散在美国、日本和泰国的输韩大米检测业务承揽回国,形成了“中国产、中国检”的输韩大米出口新局面。该机构通过对标国际,获得贸易相关国家官方授权和检测结果互认的方式,为东北特色农产品出口营造“国内检、国外认”的通关便利,以出口韩国的大米和糙米为例,该机构作为韩国官方授权的海外公认检测机构,所出具的检测报告在韩国通关时可被直接采信,
期刊
从“新闻稿纸”到“键盘敲击”再到“现场回传”,从“纸媒时代”到“微博微信”再到“VR全景”,伴随新时代的来临,互联网已经在新闻业中获得了广泛的运用,为受众提供了丰富的新闻信息,这也促进了新闻业的深刻变革。传播格局深刻调整、传播方式深度融合的今天,对新闻工作者的职业素养提出了更加严格的要求,新闻工作者必须积极探索融媒体时代的工作模式,不断提升职业素养。本文针对媒体融合背景下新闻工作者应该具备的职业素
在家庭与学校之间建立较为紧密的合作关系常被研究者和政策制定者视为一项积极的政策工具。但研究指出:家长——特别是来自农村地区的家长,参与学校教育的可能性较低。以一项持续时间较长的民族志调查为基础,对农村家长学校教育参与中的“关系化”策略的描述发现,由于正式的学校制度和组织关系总是镶嵌在更广泛的社会关系网络中,在受制度支持的组织关系本身结构性弱的情况下,其所蕴含的切事的非个人性的内容容易被私人关系的运
利用农村邻里互助的文化资源开展老年照护是我国现有条件下应对农村养老服务问题的一种模式选择与政策期待。在政策监管难以深入农村基层的情况下,邻里照护政策进入由乡村自有逻辑主导的农村政策场域之中,呈现出“剩余型”的服务范畴、“专长式”的服务内容、“默会式”的服务标准、“舆论型”的服务回报与“孝道式”的服务激励等实践形态,暴露出邻里照护政策存在邻里服务难以有效满足贫弱老人照护需求、守望相助风气式微导致政策
本文基于地区和产品贸易模型及对中国进口非关税壁垒的测算,探究了降低进口非关税壁垒对中国拓展进口多元化的影响。研究表明:中国进口非关税壁垒主要集中在预制食品、动植物产品、鞋帽与羽毛制品等品类;从加拿大、澳大利亚、泰国、越南等来源地进口的非关税壁垒较高。进口非关税壁垒降低能显著促进中国进口产品来源地和进口产品种类多元化。此外,在拓展进口来源地时,降低进口非关税壁垒对同质品的促进效应大于异质品,对资本品
目的:研究硝酸甘油致大鼠偏头痛样疼痛行为的模型评价及偏痛汤1号对本模型药效学影响。方法:采用硝酸甘油颈部皮下注射方法造模。成模大鼠随机分成模型组、阳性药组[0.25 mg/(kg·d)]、TRPV1抑制剂组[TRPV1抑制剂,3 mg/(kg·d)]、偏痛汤1号组[13.5 g/(kg·d)]、偏痛汤1号+TRPV1抑制剂组,另设假手术组、空白组,每组12只,雌雄各半。各组分别用药干预1周,同时检