基于FPGA的卷积神经网络专用异构加速器的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:cys_1688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,深度学习已经成为了一个热门的研究领域,其中卷积神经网络(Convolutional Neural Network,CNN)已经在诸如文字辨认、图片分类、目标检测等很多深度学习的领域上取得了巨大的成功。然而在一个CNN模型的前向推理计算过程中,往往需要百万次甚至上亿次浮点乘累加运算以及浮点参数的存储,使用传统的CPU或者GPU并不能充分挖掘CNN内部并行计算的特性。FPGA具有低功耗、灵活可编程和开发周期短的特点,其内部的逻辑单元能够以较低的功耗完成并行计算的任务,因此FPGA是CNN加速协处理器设计的理想选择。本课题基于Xilinx公司的Zynq系列FPGA,利用其CPU+FPGA的异构SoC开发平台,采用Verilog HDL硬件描述语言研究实现了 CNN专用异构加速协处理器。其中CPU完成软件程序部分的发送图片、轮询、中断、显示分类结果等任务,FPGA完成CNN模型的具体计算任务。本文首先对CNN的历史发展以及CNN加速协处理器的研究现状进行了介绍,然后通过对CNN前向推理的计算过程以及整体结构进行分析,详细探讨了计算过程中存在的并行性,并提出了不同并行性的实现方法及其相应的资源和带宽需求。针对广泛应用于手写体数字识别的卷积神经网络LeNet-5,本文首先利用英特尔动态网络裁剪技术将网络模型的大小进行了压缩,然后利用英特尔增量网络量化技术将模型中32比特的浮点参数量化为8比特的定点参数,并进一步优化为5比特参数来设计专用的“定点移位乘法器”。本文使用Verilog语言分别设计了乘累加阵列、池化采样、激活函数和四舍五入等计算模块,并基于流水线技术的设计思想将各计算模块进行整合,最终形成了计算精度为8比特的CNN硬件计算电路,实现了 LeNet-5网络的前向推理计算。以此为基础,本文提出了两种不同的异构SoC系统,并分别介绍了两套系统的整体架构、缓存策略以及PS和PL的设计。然后基于对SoC系统的建模,对两套系统分别进行了仿真验证。针对Mnist测试集的10000张测试图片,本设计达到了 98.9%的识别精度。实验结果表明,在优化的SoC系统中,FPGA在100Mhz的时钟频率下完成一幅手写体数字图片的推理计算耗时24us,其均值计算能力达到了 15.21GMAC/s,峰值计算能力达到了 33.6GMAC/s,性能功耗比为6.8890GMAC/W,性能功耗比为通用CPU的1520倍,通用GPU的160倍,其中CPU为英特尔i5-8400处理器,GPU 为 GTX-1050Ti 显卡。
其他文献
在国家相关政策的支持引导下,采用政府和社会资本合作(PPP)模式实施的水污染防治项目逐渐增多。合理的投资回报是社会资本参与PPP项目的关键所在。本文通过对水污染防治项目
<正>甘肃省龙首山成矿带以产出铜镍硫化物矿床而举世闻名,同时也是我国重要的铀成矿带(陈云杰等,2012)。芨岭岩体是一个多期次的复式岩体,所见的岩性主要有闪长岩、似斑状花
会议
随着我国社会经济的发展,在国民经济中处于基础地位的电力行业社会责任履行情况受到广泛关注,而社会责任会计信息披露是我们了解电力行业对社会责任履行情况的重要途径,是对
三峡大坝蓄水后,以氮磷为主的营养物质在库湾回水区大量积累,造成水体富营养化并产生水华问题。氮磷是引起水体富营养化和水华问题的主要污染物,限制氮磷污染物的外源输入与内源释放是控制三峡库区支流水体富营养化的可行途径。因此研究库区支流典型库湾氮磷污染物的收支状况对三峡库区支流水体富营养化的预防和治理具有重要意义。本研究以三峡库区主要支流小江的典型库湾高阳平湖为研究对象,通过对小江典型库湾水体、底泥以及消
为了解重金属在河湖不同水动力条件下的多介质转化机制与生态效应以及水生植物净污效果与水流影响的耦合效应,本研究利用室内水槽试验和野外现场观测的方法,针对在动水条件下
<正>迄今为止,帕金森氏病是仅次于阿兹海默氏病的全球第二大常见的神经退行性疾病,在65岁及以上人群中发病率达1%,在86岁及以上人群中发病率达4%,此病现有年轻化趋势。帕金森
会议