基于FPGA的通用卷积神经网络加速器设计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:a956280507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,神经网络已经在目标跟踪、语音检测识别、无人驾驶和抗击疫情等领域展现出卓越的性能。卷积神经网络(Convolutional Neural Networks,CNN)是其中应用最为广泛的神经网络之一。然而,CPU和GPU等通用计算平台在性能和功耗方面无法满足深度学习的计算需求。ASIC平台的神经网络加速器灵活性较差且成本较高,不能广泛用于不同的应用场景。卷积神经网络加速器的设计难点主要为:1)不同神经网络的层数有显著区别;2)各层的类型明显不同;3)不同层的参数多样并且数据量和参数量大。换言之,以上三个难点对卷积神经网络加速的灵活性设计提出了极高要求。因此,探究FPGA平台上的可配置卷积神经网络加速器通用架构,并在性能、面积和功耗等方面满足具体应用的需求具有广阔的研究空间。综上所述,本文将重点研究讨论通用卷积神经网络加速器设计方法,并针对神经网络中softmax函数提出设计和优化方法。此外,本文针对目前关注度较高的无人驾驶领域交通标志识别问题提出解决方案。本文主要工作如下:1、设计通用卷积神经网络加速器硬件架构本文提出一种支持卷积神经网络中卷积层和全连接层运算的通用计算单元。具体而言,通用计算单元支持卷积层中任意尺寸和任意数量的卷积核和全连接层中任意数量的神经元运算。以通用计算单元为基础,本文设计一种通用卷积神经网络加速器硬件架构。2、提出精度可配置的softmax硬件架构本文总结神经网络分类的一般规律,有效地解决softmax层输入数据范围过大问题。此外,本文提出一种计算精度可变的指数函数计算单元并改进一种基于麦克劳林级数前两项的自然对数函数计算单元实现softmax层可变精度运算。指数函数计算单元的计算精度能够在23位、35位和42位精度中自由调整。改进后的自然对数函数计算单元将原设计中的2-32位的计算精度缩小至15-25位。3、制作基于FPGA的无人驾驶系统验证平台针对相关工作中的标志不适用和过于理想化的数据集、网络规模大和权重参数多的神经网络结构和资源消耗大、制造成本高的ASIC加速器,本文提出数据增强方法制作数据集、探索精简版神经网络架构并在硬件层面将多个神经网络融合到同一套硬件架构中。本文设计模拟道路交通场景,通过摄像头采集场景信息指挥智能车模型完成相应动作。
其他文献
计算机视觉系统已经广泛地应用于各类户外场景中,例如城市交通、视频监控、遥感成像、航拍、机器人系统、工业控制等领域,并且发挥着越来越重要的作用。但是,当雾霾严重、烟气和灰尘弥漫于空气中时,在如此恶劣的天气状况下,大量的微小水滴和气溶胶颗粒悬浮于空气中产生散射作用,这将会导致室外机器视觉系统拍摄的图像具有对比度低、色彩信息严重丢失并且掺杂大量噪声等特点,这严重降低计算机视觉系统在室外实际情况下的工作性
颅面复原技术是法医人类学的热门研究课题。颅面检索包括颅骨检索和复原面貌检索两个技术环节。颅骨检索是从颅面数据库中检索出与给定颅骨形态最相似的颅骨。复原面貌检索是
大数据平台Spark近年间已逐渐成为业界热点,其基于内存计算的特性在机器学习和神经网络等迭代式应用场景中可以提供非常快的任务运行速度,现已被应用于百度、美团、腾讯和阿
城镇基准地价制度是我国地价体系的重要组成部分,在地价的宏观调控和土地使用税的征收等方面发挥着重要的导向作用。从理论上来说,城镇基准地价应该与各地区位、经济社会发展
形式概念分析(Formal Concept Analysis,FCA)与粗糙集理论(Rough Set Theory,RST)作为数据分析和知识获取的数学工具,已成为人工智能领域的重要研究方向.为了提高粗糙集理论
移动无线传感网络(Mobile Wireless Sensor Network,MWSN)是一种近几十年来获得快速发展的传感网络。在煤矿井下发生事故时,传统的网络通常会被损坏而无法回传井下信息,十分
多目标显著性检测,是一个能够从图像中自动检测出两个或者两个以上的显著性物体的计算机视觉处理过程,但因为目标大小不定,位置各异,数目不同,色彩多样,是显著性检测领域新的挑战。超像素分割常用来对图像进行预处理,以提升算法整体性能,本文首先基于“梯度下降”的方式对超像素分割算法进行了研究,随后重点研究了基于超像素分割和“自底向上”思想的面向单幅图像中多个目标的显著性检测算法设计及其应用,主要工作与创新点
全场光学血管造影是一种新兴的血管成像方法,具有较高的时空分辨率,适合应用于在体的实时成像,具有很好的临床应用前景,已被广泛应用于视网膜、斑马鱼和老鼠耳朵中的血管成像
随着位置服务的日益发展,人们对于位置服务的需求也从室外扩展到了室内,但是由于墙壁对电磁信号的削减,室外定位系统难以满足人们在室内对定位系统精度的要求。精确的室内定
无线可充电传感器网络(Wireless rechargeable sensor networks,WRSNs)中,节点部署直接关系到网络监测是否有盲区以及网络成本。WRSNs节点部署不同于传统的无线传感器网络,因