深度神经网络硬件加速研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:dengyq2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体工艺的不断进步,机器学习领域研究的深入,神经网络成为了近年来实现人工智能的重要机器学习算法之一。神经网络尤其是深度神经网络因其结构的复杂带来的计算复杂度的上升,使得单纯用中央处理器顺序串行执行耗时越来越长。这样不仅给网络的训练带来问题,也给对于实时性有一定要求的网络计算任务带来了问题。因此人们提出了各种各样硬件加速的方式。其中一种比较常见的硬件加速方式是取代了过去数字信号处理器而出现的现场可编程门阵列(Fieled Programmable Gate Array,FPGA)。FPGA以其比较好的并行性和灵活性以及开发成本相对较低等特性受到高校等研究机构的青睐,甚至在一些应用场景直接用于商用产品的开发。目前,大多数FPGA的加速主要针对复杂指令集计算机,即CPU以X86或AMD64为主的计算机,并通过PCIe接口与CPU交换数据和控制信息。并且目前大多数FPGA仅仅加速已经完成训练的神经网络,而不会加速网络的训练过程。为了达到最佳的加速性能,通常FPGA加速会针对特定的神经网络进行优化,使得神经网络的FPGA加速的通用性变差。本文提出一种基于ZYNQ的FPGA加速结构。它以ZYNQ内部自带的ARM(Advanced RISC Machine)作为主要计算核心,ZYNQ自带的FPGA作为神经网络的硬件加速部分,兼顾结构中软硬件的通用性和可扩展性,实现嵌入式神经网络的计算加速。本文提出的结构中,将神经网络中的全连接的矩阵乘法运算以及卷积运算放到FPGA上进行,而ARM负责流程控制,池化和激活函数的运算。本文结构在尽量满足通用性的前提下加速神经网络,因此本文结构中FPGA的互联采用标准的AXI系列协议,并且通过互联模块连接逻辑与处理器。本文中详细描述了关键的软件函数流程以及硬件加速电路的结构。并且在实现了整个结构后,通过LeNet-5手写数字识别网络对加速架构进行测试。在10000张MNIST图像的测试下,识别率在92%,使用FPGA加速前后效果不是特别明显,一张图片的处理时间仅仅减少了1%。
其他文献
新课程改革的实施与推进,为当前延边地区的基础教育注入了一股活力,也为小学心理健康教育发展提供了新的平台。这缘于新课程与心理健康教育相一致的目标理念:第一,都倡导创设
试题讲评是学科教学的有机组成部分和重要环节,它以典型试题为载体,以提高学生分析解决问题的能力为目标,是涉及师生、生生、个体和群体、群体和群体之间综合互动的教学过程.
本文从过去、现在和将来三个时间段分析了以空间模块为单元的装配式方法的案例和可能性,并讨论其在中国的可行性。
宏观经济周期波动引发的各种微观经济组织出现财务风险或危机的现象,已成为一种不以人们意志为转移的客观经济规律。如何应对由于经济周期性波动而引起的企业出现的周期性财
以推求南方某市暴雨雨型为例,研究了3种暴雨雨型推求方法,并综合分析了各方法的优缺点和适用范围:当降雨资料充足时,应优先选用同频率放大法推求出长历时暴雨雨型;当降雨资料较少
为研究爆炸冲击波对钢化玻璃的毁伤阈值,开展了钢化玻璃冲击波毁伤效应实验。对每一发实验进行了爆炸参数测试,获得了冲击波超压随时间变化历程的实验数据。通过对实验数据的
本文针对通信对抗设备统配技术研究的现状及对设备统配辅助决策的需要,在较为全面地研究了通信对抗设备统配技术理论及应用方法的基础上,通过利用模糊控制、模糊综合评判理论
马克思主义中国化的两个思想根源是马克思主义和儒学传统。对马克思主义中国化发展史的研究是马克思主义者要普遍具备的实践品格。在当代的发展中存在时代发展的问题,是马克
2,6-二氯苯并恶唑是合成低毒、高效、低残留的植物保护剂(如除草剂精恶唑禾草灵:2-[4-(6-氯-2-苯并恶唑氧基苯氧基)]丙酸乙酯)的重要中间体。本文探讨了合成2,6-二氯苯并恶唑
巯基乙酸(Thioglycolic acid,简称TGA)又名硫代乙醇酸、氢硫基乙酸、巯基醋酸,由于分子中同时含有羧酸基和巯基两个极性集团,因此作为一种重要的化工原料及化学中间体被广泛应用