【摘 要】
:
现阶段,快速发展的卷积神经网络已经在图像分类、目标检测、语义分割等应用领域展现了优异的识别和分类能力,卷积神经网络性能提升成为卷积神经网络推广应用的关键突破点。面临着卷积层数加深、数据运算量和存储量不断增长的挑战,传统软件加速方式难以满足应用实时性的要求,研究卷积神经网络的硬件加速技术成为必由之路。本文通过分析卷积神经网络算法,研究并设计了具有高性能的卷积神经网络加速器,能够有效提高卷积神经网络算
论文部分内容阅读
现阶段,快速发展的卷积神经网络已经在图像分类、目标检测、语义分割等应用领域展现了优异的识别和分类能力,卷积神经网络性能提升成为卷积神经网络推广应用的关键突破点。面临着卷积层数加深、数据运算量和存储量不断增长的挑战,传统软件加速方式难以满足应用实时性的要求,研究卷积神经网络的硬件加速技术成为必由之路。本文通过分析卷积神经网络算法,研究并设计了具有高性能的卷积神经网络加速器,能够有效提高卷积神经网络算法性能。1.论文首先研究并设计了一套卷积神经网络加速指令系统。在充分分析典型卷积神经网络算法的拓扑结构和相关运算操作的基础上,为了降低单个运算核心的数据存储量提高数据重用性,研究了卷积神经网络算法划分技术,设计了面向卷积层、池化层、全连接层的基本运算函数集,通过函数调度简易地映射整个卷积神经网络算法;在充分分析卷积层、池化层、全连接层和激活函数等运算操作的基础上,归纳总结了卷积神经网络的运算逻辑,研究并设计了卷积神经网络加速器的基本运算指令;在充分分析卷积层、池化层、全连接层运算过程中数据位置变换特征,归纳总结了卷积神经网络的存储逻辑,研究并设计了卷积神经网络加速器指令寻址方式、存储阵列换位方式。2.论文研究并提出了一种基于近算存储阵列架构的卷积神经网络加速器。为了减少访存带来的延迟,结合卷积神经网络存储逻辑特征,提出了近算存储阵列架构,能够通过移位、换行等操作实现特征图数据的快速位置变换;为了降低运算资源和存储资源需求,提出了逐层参数量化方法,在保证卷积神经网络算法精度的前提下,将各层浮点数据转化为定点数据表示,并根据指令系统要求设计了基本运算单元;为了进一步优化加速器性能,设计实现了多粒度并行的优化策略,开发特征图卷积窗口、输入通道、输出通道三个层次的并行性。3.论文搭建了卷积神经网络加速器综合验证平台,并进行了功能验证与性能测试。在平台搭建方面,搭建了算法验证平台、仿真验证平台和硬件测试平台,以VGG-16算法为例进行函数划分,以Image Net数据集为基础产生测试激励,分别通过函数验证和系统验证证明了卷积神经网络加速器的正确性;在资源消耗方面,对不同配置的卷积神经网络加速器的资源占用进行了评估;在性能测试方面,对卷积神经网络加速器进行了性能测试与评估,经测试,采用256核配置方案的卷积神经网络加速器运算性能达到50.47GOPS,是Matlab软件并行实现的51.62倍,较已有的基于FPGA硬件加速器性能提升约为3.15~9.61倍。
其他文献
近年来,我国公共基础设施建设的发展正处于快速阶段,为了缓解政府部门财政投资的压力,逐渐引入社会资本参与进来,PPP融资模式发挥着重要的作用,并逐步在我国公共基础设施建设
对于平面端射圆极化天线,高增益特性是一个重要的性能指标。然而现有高增益平面端射圆极化天线的剖面尺寸大于0.1倍波长,结构复杂且前后比较低。如使用基片集成波导(SIW)喇叭天线和引入附加介质透镜的天线等,固然能提高天线的增益,但这增加了天线整体轮廓大小和设计复杂度;采用八木天线和平面双向圆极化天线虽然能有效降低天线的剖面高度,但这些天线的前后比并不是很高。因此如何设计低剖面、结构简单、高增益、方向性
随着经济社会的不断发展与人类生活水平的提高,环境绿化越来越受到人们的重视,割草机也成为我们生活中常见的绿化工具。然而,割草机发动机产生的振动与噪声很大程度上影响了工作人员的的身体健康以及周边人们的生活环境。合理设计悬置支撑系统,既能有效隔离动力总成的振动和道路不平造成的冲击,又能延长发动机及其零部件的使用寿命。因此,本文以坐骑式割草机发动机为研究对象,通过实验测试,收集相关数据,采用ADAMS软件
声子晶体是一种人工周期复合材料,其特殊的带隙、负折射、自准直等特性,引起了广泛的关注和研究。弹性波在声子晶体中无法传播的频率范围,称为带隙。此性质在隔振降噪领域具
随着人类对海洋资源的重视,自主水下航行器(Autonomous Underwater Vehicles,AUV)逐渐显现出其重要性。AUV对接回收是AUV实现工作续航、数据交换的有效方式。通过AUV与水下回收机构的连接,使AUV在能源耗尽前能够及时得到能源补充,并且将采集到的数据及时上传,进行数据交换。海洋环境极其复杂并且充满不确定性,在实际运行中,由于其强非线性、不确定性、多耦合性等特点,很难建
数字图像相关(Digital Image Correlation,DIC)方法是一种非接触的新型全场位移变形量测光学方法,相较于其他量测方法其不仅量测条件要求较低还具有数据获取简单、非接触、量测精度高、全场测量等优点。近年来,随着计算机性能的进步,相机像素的提高,数字图像相关方法被广泛应用在医学、材料科学、航空航天等领域,并且拥有不错的试验效果,取得了长足的发展和进步。本文总结了现有的各种位移变形
吲哚类化合物作为非常重要的构筑砌块,广泛存在于天然药物、药物制备和具有生物活性的化合物和有用的有机合成中间体中。取代吲哚烷基化的传统合成方法使用了光催化剂或者过
乌鲁木齐地区青少年拳击队是新疆拳击队的重要后备人才基地之一,多年来为新疆拳击队甚至国家拳击队输送了众多优秀拳击运动员。目前,乌鲁木齐地区青少年拳击队与新疆其他地区
暴露于环境毒物和压力源、辐射、药物、炎症、细胞呼吸以及常规DNA代谢都会导致细胞毒性DNA链断裂的产生,DNA链断裂后通常缺少DNA合成和DNA连接所需的5’-磷酸和3’-羟基的部
中华武术,一个神秘又具有历史意义的体育运动项目,在中国历史上可以说是不可不提的一个重要文化遗产,武术是中华民族传统体育项目,具有强身健体、防身自卫、修身养性的功能价