基于组合三值量化的神经网络压缩算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:yzahnig621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习再次掀起了人工智能技术的浪潮,并被成功地应用于许多领域。然而以卷积神经网络为代表的深度学习模型,参数规模巨大且计算成本高昂,非常依赖GPU甚至GPU集群等高性能计算设备。这严重限制了深度学习模型部署应用在硬件资源有限的边缘计算场景中,因此对深度神经网络进行模型压缩成为目前的研究热点。量化作为卓有成效的压缩方法之一,使用低精度数值替代原始浮点参数,可以有效降低模型参数内存和计算能耗。当神经网络的权重和激活值都被量化到1bit或2bit时,加速效果最为显著。然而,量化比特数越低,伴随的计算误差越大,并且这些误差还会在神经网络的前向计算和反向传播时层层累加,从而不可避免地造成严重的精度损失。针对这一问题,采取合理的量化策略,在算法通用性、压缩能力和精度损失之间取得平衡,具有重要意义。本文在卷积神经网络的三值权重量化和激活值定点量化的基础上,做了以下相关工作:(1)提出了组合三值量化权重的算法,以多个尺度系数和三值权重的乘积组合量化卷积层权重。与直接量化相比,带尺度系数的二值或三值权重能够减小量化误差。组合三值量化虽然会增加少许参数和计算量,却能突破单个量化权重的局限,具有更好的拟合效果。(2)基于2bit定点量化,提出使用箱型图统计激活值张量的数据分布,截断其中的异常值。研究了直接定点量化激活值时,可能存在一些数值较大的离群点,导致大量信息在量化后被丢失。该方法可以使得量化前数据的分布更加均匀集中,让量化误差保持在正常范围之内。(3)结合权重和激活值量化策略,形成整体的卷积模型量化架构,根据反向传播算法,给出了量化架构的完整训练流程,并详细介绍了训练算法中的相关细节。在模型推断计算时,可以将绝大部分浮点数运算转换为更高效的定点整数运算。在图像识别任务中,对比原始浮点数模型和其他量化模型的预测准确度,该量化算法在保证通用性和压缩能力的同时,还能有效降低精度损失。
其他文献
在社会经济高速发展的时代大环境下,第一产业的新增长点就是农产品加工业,正逐步发展成为国民经济得以高速增长的主要推动力量。但是,目前,对于农产品加工业而言,在运营发展中所面临的主要问题就是融资难,这也是阻碍其健康发展的主要因素,这也极大的束缚了社会经济的有序发展。近年来,尽管幕阳市农产品加工业获得了长足发展,但是融资难依旧是阻碍行业企业健康发展的主要问题,也约束了该市经济发展达到最为理想的状态。本文
新修2017年《反不正当竞争法》在第二条一般条款中将“市场竞争秩序”位置前置,增添了消费者元素,并增设了第十二条“互联网专条”。但新法修订施行以来,由于互联网经济纠纷的复杂多样性,市场中出现了大量专条无法涵盖的新型互联网案件。因此在司法实践中,法院仍需要大量适用第二条一般条款对互联网不正当竞争行为进行认定。快乐阳光诉广州唯思案等互联网不正当竞争纠纷案即属于这类情况,法院在适用一般条款审理该类案件的
近些年新课程改革正深入推进,语文作为小学课程体系的重要组成部分,教学理念、教学手段都发生了较大变化。教师要充分尊重学生的主体地位,充分发挥“主题单元教学”的优势,突出语文学习的综合性和整体性特点,帮助学生构建知识框架,整合教育资源。基于此,本文对小学语文主题单元教学的有效策略进行了分析。
新晋独立电影厂牌A24出品的恐怖电影具有其独特的恐怖美学,即在题材内容方面追求人文视角介入,视听语言方面重视创新表现形式,并独具深度哲学视角。本文结合A24出品的几部恐怖电影代表作,分别从叙事内容、视听语言、哲学元素三个维度切入,解析A24系恐怖电影的美学特点,以见出其拥有构建崭新恐怖电影图景的巨大潜力。
本文以“明代晚期地方胥吏无赖化现象研究”为题,聚焦因无赖渗透地方胥吏集团,以及因胥吏与无赖在行政、司法、经济、监察等领域共谋利益,影响地方事务正常执行与社会秩序稳定的历史现象。通过对明代晚期地方胥吏无赖化现象的分析和相关史料的挖掘,有助于推动胥吏和无赖的社会群体研究走向深入,为明代“衙蠹”问题提供社会面向的解释途径,并期以丰满完善明代地方社会、地方行政议题的认识和探索。第一章择选明代晚期判牍材料中
国外研究表明,在成熟资本市场中,高声誉投资银行在IPO中能发挥认证和督导的作用,抑制IPO公司的盈余管理程度。但在基于我国资本市场的实证研究中,投资银行声誉是否能发挥作用没有形成一致的看法。因此,本文将以我国A股为研究对象,对投资银行声誉与IPO公司盈余管理之间的关系进行研究。本文整理了国内外相关投资银行声誉和盈余管理文献,对投资银行和公司盈余管理的内涵以及二者的影响因素进行梳理。手工收集证监会、
目前在电商企业价值评估与管理中,对客户资产价值难以有效的识别与计量,导致客户资产在电商企业不被重视。而在互联网时代背景下,电商企业之间的竞争不再局限于差异化的产品、成本等因素,客户资产作为一项无形资产,虽在企业价值提升中不能单独发挥效用,但是成为了电商企业的无法复制和取代的核心竞争力。因此明确电商企业客户资产价值,成为必须之举。本文研究明确客户资产是无形资产的所属部分,从电商企业的角度出发将客户资
安然、世通事件发生后,为遏制愈演愈烈的财务造假事件,美国国会通过了《萨班斯奥克斯利法案》,整合审计应运而生。整合审计提高了双重审计的工作效率,降低了双重审计的成本。在我国的上市公司也频频出现内控失效和财务舞弊事件后,财政部等五部委充分认识到内部控制审计的重要性。2008年以来,我国先后发布了《企业内部控制基本规范》和《企业内部控制审计指引》,标志着上市公司进行内部控制审计开始走向强制化,2011年
在现代公司治理框架下,高管团队的决策选择体现了公司的战略偏好与发展方向,并最终体现在企业的绩效水平上,对于上市保险公司而言,这种趋势更为明显。高管团队的特征从客观的角度体现了团队成员在实际工作中的认知、经验、能力以及价值观等重要因素,其特征上的差别将给企业带来不同的收益。本文主要研究高管团队特征对我国上市保险公司企业绩效的影响,从而为公司合理配置高管团队结构、提高企业绩效提供实际建议。本文以200