深度学习的硬件实现与优化技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Xiongbaobao520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能的兴起,以深度学习为代表的新型智能算法在机器视觉、图像处理、模式识别等多个工程应用领域得到成功应用。但是,在工业大数据的冲击下,传统的软件实现方式无法满足实际工程低成本、高时效、高容错率的需求,因此急需寻求新的解决方案。现场可编程门阵列FPGA作为一种常用硬件开发平台,拥有大规模的分布式硬件资源,并且具有开发周期短、功耗低、性能好等特点,非常适合计算密集型的深度学习算法的实现。本文以FPGA为硬件开发平台,展开深度学习的硬件化实现与优化技术研究,主要研究内容如下:首先,深度学习硬件实现总体方案设计。详细分析深度学习的理论基础知识,并以卷积神经网络为例,进行网络的拓扑结构和功能特点研究,给出本文硬件实现的具体网络拓扑。根据网络拓扑的结构特点,进行系统的总体方案设计,将网络拓扑映射到具体的硬件电路。其次,完成算法硬件移植的优化技术与架构设计。选择FPGA作为本文实现的硬件移植平台。结合本文实现低功耗、高效率深度学习算法的目标,分别对硬件移植的优化技术进行深入研究,并应用优化技术完成对卷积神经网络从粗粒度到细粒度的并行架构设计。然后,完成基于FPGA的卷积神经网络设计与实现。以FPGA为硬件开发平台,完成卷积神经网络的整体架构设计。根据卷积神经网络的结构特点,完成设计各功能电路模块,包括卷积运算模块、抽样运算模块、激活函数模块。本文设计乒乓缓存结构,优化数据传输结构和数据缓存单元。用仿真软件Modelsim分别验证各模块功能正确性。最后,搭建系统整体实验平台。依据现有的实验条件,配置网络结构与参数,设计“FPGA+CPU”的异构体系,完成卷积神经网络的硬件固化。以手写数字识别为具体应用,完成软件和硬件的对比实验。通过大量的实验统计,结果表明本文设计的基于FPGA的卷积神经网络功能完整,性能优异。
其他文献
主要针对现阶段市场当中常见的广告投放媒体进行研究,对各种广告转播媒体的优缺点进行分析总结,再结合企业品牌或产品自身的情况和特色进行筛选和组合,能够最大限度的保障广
消费社会中博物馆功能及角色的转变,使博物馆作为区域文化地标对打造区域整体品牌形象、区域时间感改造产生重大影响,使博物馆自身从规划、外观和内部空间设计、文化产业经营
人的心理、意识是在活动中形成和发展起来的。要改变现状,班队建设中,老师要做智慧的引路人。教师需要对不同年龄阶段学生成长需要与问题进行序列、内容及活动方式进行研究,
交流电动机调速系统受到电力电子技术、微电子技术以及集成电路发展的影响。在多方面的影响下,交流电动机调速性能越来越强。这其中鼠笼式交流异步电动机变频调速系统性能已
目的了解2016年渭南市农村生活饮用水理化指标监测情况,为渭南市农村饮用水水质监测提供参考依据。方法以全市10个县(区)农村地区的小型集中式供水点作为监测点,根据《生活饮
细菌性中枢神经系统感染是常见且严重的颅内感染性疾病,其早期实验室诊断对治疗和预后有重要作用。细菌性中枢神经系统感染的实验室诊断由脑脊液常规和生化等传统检测,逐渐发
目的探索如何优化公立医院内部控制。方法采用问卷调查等方式,对公立医院内部控制的控制环境、风险管理、控制活动、信息与沟通、监督等5个要素存在的问题进行了深入调查与剖
<正>黄瓜霜霉病是世界范围内黄瓜产区主要叶部病害之一。选育和培育黄瓜霜霉病抗病品种是一种安全、环保和高效的控制策略。在蛋白质水平上对细胞应激反应的研究是对mRNA水平
会议
本文旨在通过对中职数学教学面临的现状着手,讨论微课在中职数学课堂教学中的应用,以及微课在数学教学应用中出现的问题及对策,为进一步推动中职数学教学改革提供一些参考。
材料的复合化是当今材料发展的主流之一,而且关于异种金属材料的复合更是材料领域研究的热点。不锈钢复合板作为一种典型的异种复合材料,其既具有不锈钢材料良好的耐腐蚀性同