【摘 要】
:
基于神经网络的方法相对于传统的方法而言,其表现性能通常远超同领域的传统算法,在许多领域已取得实质性应用,如:语音识别、目标检测、目标分割等。但是基于神经网络方法的计算量通常十分庞大,这限制了神经网络的方法在嵌入式场景,如:VR/AR、手机、智能安防、自动驾驶等的应用。为了解决这一问题,本文旨在探究一种工程上可行的、面向嵌入1式平台的卷积神经网络的部署方案,并以FPGA(现场可编程逻辑门阵列)为原型
论文部分内容阅读
基于神经网络的方法相对于传统的方法而言,其表现性能通常远超同领域的传统算法,在许多领域已取得实质性应用,如:语音识别、目标检测、目标分割等。但是基于神经网络方法的计算量通常十分庞大,这限制了神经网络的方法在嵌入式场景,如:VR/AR、手机、智能安防、自动驾驶等的应用。为了解决这一问题,本文旨在探究一种工程上可行的、面向嵌入1式平台的卷积神经网络的部署方案,并以FPGA(现场可编程逻辑门阵列)为原型验证,为搭建基于FPGA的卷积神经网络加速器提供系统级的支持。本文以YOLO算法为代表总结了卷积网络的计算特性,并分析了卷积网络算法使用FPGA实现的可并行性;考虑到FPGA计算过程需要使用定点计算,与现有网络的浮点运算过程相冲突,因此改进了一种卷积网络的整型量化方法,该方法使用统计的极值动态量化网络的输入、输出以及权重,保证了网络前向推导采用全整型计算,解决了FPGA上数值计算冲突的问题。值得一提的是,本文改进的卷积网络量化方法,简化了卷积网络前向推理的计算的同时,可以保证网络的精度损失低于2%。而后,基于HLS(高层次综合)设计了YOLO算法的硬件加速架构,该系统架构包括两个部分:可编程逻辑实现卷积网络前向的并行计算、ARM实现数据调度;之后,本文基于Xilinx ZC706评估开发板设计了一个通用算法验证平台,对本文设计的YOLO算法的并行加速架构进行了功能验证和系统验证。本文设计的YOLO算法的硬件加速架构,相比于CPU可提速19倍。最后,分析了本文改进的网络量化方法的性能,并对比了量化前后的网络性能的损失。同时,展示了硬件实现的资源使用情况,也对比、分析了YOLO算法在FPGA上实现的性能。在文末,指出了本文存在的不足之处和进一步研究的方向。
其他文献
背景:支气管哮喘是由嗜酸性粒细胞、肥大细胞和T淋巴细胞等多种炎性细胞和细胞组分参与的气道慢性炎症性疾病。研究证实,支气管哮喘的发病与Th1/Th2失衡有着密切关系,Th2细胞
目的通过四氯化碳(CCL4)以及低浓度酒精等复合因素诱导大鼠肝硬化的同时给予荜茇提取物溶液灌胃,观察与研究各组大鼠体重及精神状态、肝脏损伤程度、肝脏中肿瘤坏死因子α(Tumor necrosis factorα,TNF-α)、白细胞介素-6(Interleukin-6,IL-6)的表达及肠道微生态的变化,来探讨荜茇提取物对大鼠肝硬化的防治作用及相关机理。方法动物分组将从内蒙古医科大学实验动物中心购
2008年12月30日我在与理查德·克莱德曼的同台钢琴合奏演出中,感受到了他的非凡的音乐和寓教于乐的钢琴艺术教育:他用“身教胜于言教”展示了精益求精、做好细节的大师风范;
该文对天星横河的桥型选择、结构计算分析过程进行了阐述。该桥新颖的结构组合形式为小型景观桥设计提供了新的思路。
钙振荡(calcium oscillation)是胞浆游离钙的一种较为普通的运动形式,有着很重要的生物学意义,参与体内许多生理病理反应。支气管哮喘(简称哮喘)是一种慢性气道炎症性疾病,与
目前,关于人参的研究主要集中在皂苷、蛋白质和多糖等水溶性成分和活性方面,而对其脂溶性部位的研究较少。课题组对人参脂溶性成分中的倍半萜化合物进行了研究,建立了人参倍半萜有效部位(Sesquiterpenoids of Panax Ginseng SPG)的提取分离方法,并对其抗抑郁和抗急性肝损伤药理活性和作用机理开展了实验研究。主要研究内容及结果如下:1、SPG提取方法的建立和成分分析本文利用超临界
随着社会不断发展,计算机电子信息化的建设发展越来越激烈,很多高校毕业论文管理信息系统已经被学校推广到了各地,这样一来高校信息化进程就会得到一定的发展,资源管理模式的
湖南省张家界市第一幼儿园创办于1958年,其前身为“大庸县机关干部职工子女幼儿园”,现系张家界市永定区教育局主管、财政全额拨款的事业单位。
目的:(1)使用透射电子显微镜观察年老大鼠心脏Telcoytes(cardiac telocytes,CTs)的超微形态;(2)利用免疫荧光染色对CTs在年老心脏的分布进行研究并且观察心脏Telocytes随增龄
光纤Fabry-Perot(FP)传感器因其具有精度高、体积小、动态范围大、结构简单以及抗电磁干扰等优点而被广泛应用于航空航天、油田、桥梁、医疗等领域实现外界物理量的测量,诸如:压力、温度、应力/应变、折射率、位移等。而对于光纤FP传感器的实际应用而言,关键问题是如何通过FP腔长度解调获得被测量。本文基于腔长匹配原理,采用光楔与CCD线阵的组合结构,设计并实现了用于外界物理量高精度、大动态范围测量