基于类脉动架构的高性能卷积加速器的设计实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:emailtoli2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在21世纪的如今,人工智能已经成为了研究热点并且应用于人类社会的诸多领域。深度学习是人工智能的重要领域,神经网络则是深度学习的基本框架,其中的代表性框架之一就是卷积神经网络。卷积神经网络擅长处理视觉信息,在图像的识别、分类等任务上有重要的应用。但卷积神经网络运算量庞大,要将其应用于对实时性和功耗要求都非常高的场合,需要在硬件设计上进行针对性的优化。本文提出了一种面向卷积神经网络的专用加速器。该加速器采用类脉动计算阵列,实现了卷积核并行和图像批次并行两种并行计算方式。数据处理采用了定点动态化的方案,避免了运算过程中的数据溢出问题。使用乒乓数据存储和传输方式,从而掩盖DDR到内部SRAM之间的数据传输时间。卷积参数均可配置,以提高其灵活性。该加速器在CMOS 14nm工艺下,实现了1GHz的工作频率,峰值运算能力达到2.08 TOPS,核心面积为1.86mm2,功耗为209.8mW。在AlexNet卷积层的测试中,吞吐率为950.2 fps,能效达到9.5 TOPS/W,计算效率达到96.2%,通过乒乓操作优化了3.5%~21.2%的数据传输时间(SRAM与DDR之间)。与国内外其他同类ASIC实现相比,实现了2.2~7.4倍的归一化吞吐率,4.5~34.1倍的能量效率以及11.1%~34.8%的计算效率提升。本文提出的加速器具有高性能、高扩展性等特点,适用于实时性要求比较高的场合,具有较好的应用价值。
其他文献
学位
银行信用卡业务的办理中,对信用卡客户的身份识别认证保障了账户数据的安全。身份证识别和人脸比对是身份识别的关键步骤。旷视科技为招商银行信用卡中心提供的多个身份证识别和人脸比对算法的企业级解决方案,以API接口形式提供服务。需要对新版本新引入的算法和不同类型的算法进行验证和比较。对图片样本进行分类测试,对身份证识别和人脸比对算法通过多个指标进行验证和比较,帮助企业选择更好的算法产品为业务部门服务,为节
在软件生命周期的每个阶段都不可避免的引入bug。开发人员,测试人员和最终的系统用户都可以使用错误跟踪系统来提交bug,对于开发人员来说,查找和修复bug是软件生命周期中的重要过程。为了更好地做到自动定位和修复bug,我们需要去总结归纳不同类型的缺陷,现有的分类法大多数是原因驱动的,比如根据导致错误的原因进行分类。修复模式指在修复补丁中重复出现的抽象结构,错误修复模式是由语法驱动的,它与程序文本紧密
近年来电商行业带动了传统物流业的发展,展现出一片蓬勃之气。随着经济的不断发展,人们的生活水平有了显著提高,对农副产品的需求量越来越大,农副产品物流运输业也得到了快速的发展。另外环境问题日益严重,威胁着人们的生存空间,低碳农副产品物流就是研究分析在农副产品运输配送过程中如何合理规划路线使得运输总代价最小,提高客户满意度,降低碳排量,减少对环境带来的危害。本文首先根据农副产品物流问题的实际情况,建立了
学位
学位
随着物联网的发展,智能家居的解决方案被广泛应用,用户对智能化的要求程度也越来越高。智能家居的交互方式也从实体按钮控制向终端触屏控制甚至语音控制不断发展。同时,因空气污染、疫情等原因,用户对新风机需求上升。因此,将智能新风和语音交互相结合的方案受到了更多的重视。面向智能新风的语音交互系统让用户可以通过语音的形式与家居设备进行交互。用户可以通过小程序远程语音控制新风设备,比如开关设备、调节设备风量、设
NAND型闪存是一种主要的非易失性存储器,具有存储密度大,功耗低,成本低,抗震性能强等特点,目前已广泛应用于消费级移动电子设备和企业级服务器中。随着半导体工艺节点的进步,NAND型闪存的特征尺寸不断减小,多级存储技术和3D堆叠技术成为NAND型闪存中的主流,3D TLC NAND型闪存占据了消费级闪存的主要市场。然而3D TLC NAND型闪存中存在着各类噪声干扰,威胁着数据的可靠性。其中,编程干
LDPC(Low-Density Parity-Check)码作为信道编码的常用方法,在诸多通信系统中得到广泛应用,但是在其迭代译码中存在着错误平层的问题,这对某些LDPC码的特殊应用场景造成了较大的困扰。研究证明陷阱集与错误平层有着非常紧密的联系,而后处理方法能针对陷阱集进行处理,以此来降低错误平层。本文对常见的陷阱集进行了分析,并提出了一种基于迭代标记的后处理方法,使用该方法得到的标记后的码字
20世纪以来红外成像技术得到广泛的应用和发展,在众多领域如军事领域中已经成功的利用它实现了在黑暗中观察。相应的红外图像中的目标检测技术也得到了相应的发展,从传统的边缘特征提取、阈值分割等方法,到现如今基于深度学习和神经网络的方法得到广泛使用。然而红外成像技术依然面临成像质量不高、可观测特征有限等问题,加上在如军事应用中,目标在图像中往往呈现小而模糊的特征,因此给直接进行目标检测带来一定的困难。自从