基于NVDLA的深度学习推断芯片研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:eddiew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,机器学习方法与神经网络结构越来越复杂化,大量的数据计算对处理这类应用的计算芯片算力有着越来越高的要求,特别是深度学习技术的出现,其应用中神经网络层结构越来越多,内部处理数据量也越来越大,这就要求处理芯片具有很好的适应性与性能。同时深度学习与神经网络的应用场景越来越多,根据任务量与应用特性,考虑芯片布置成本,设计高效率的芯片解决方案显得十分重要。现阶段深度学习主流的芯片解决方案包括通用处理芯片CPU与GPU,FPGA与异构计算处理方案及专用集成芯片(ASIC)方案,各个方案计算效率上均有其优势与不足,需根据场景相应布置。在相关芯片解决方案的探索中,主处理器加上深度学习专用模块来支持神经网络结构与深度学习应用提供了一种新的思路,此类解决方案可以称为AI芯片,有其计算优势与较好的场景适应性,在移动设备与轻量级应用中相关芯片形成AI处理器具有了较高的计算效率。本文开展了 AI芯片解决方案中深度学习专用加速模块的研究,重点引入NVIDIA深度学习加速器NVDLA进行了芯片加速模块的探究。本文阐述了深度学习与神经网络的相关知识,包括机器学习的方法概述与神经网络的基本构成,以及深度神经网络与卷积神经网络两类典型的深度学习神经网络,重点划分了卷积神经网络执行深度学习推断过程时各个网络结构的阶段工作,解析NVDLA内部芯片模块对卷积神经网络执行推断任务的硬件加速将其与之对应。本文开展了对NVDLA硬件架构规范、软件开发环境和虚拟平台的研究,使用Caffe深度学习框架下的LeNet模型与AlexNet模型两个经典卷积神经网络模型作为测试实例,在虚拟验证平台下完成对NVDLA的功能测试,评估了NVDLA的功能性以及对深度学习框架与神经网络结构的支持。研究在联华电子80nm工艺下对NVDLA的激活引擎模块、池化引擎模块和本地响应规范化模块三个芯片核心模块进行了芯片逻辑综合与芯片物理实现评估,并探究了影响芯片规模的相关NVDLA硬件设计参数。本文对NVDLA进行了探索性的验证与评估,对NVDLA的集成与应用具有指导意义,同时深入分析NVDLA内部核心模块与卷积神经网络特征结构,以及NVDLA内部数据路径,对自行设计深度学习专用加速硬件模块和相关软件调度方案具有一定的借鉴意义。
其他文献
在媒体竞争十分激烈的今天,报纸文化报道的重要性日趋凸显。本文以《成都日报》的《文化壹周》专刊为例,探讨提升党报文化报道的途径。
川崎病(KD)又称皮肤黏膜淋巴结综合征(MCLS),是一种急性发热出疹性疾病,好发于婴幼儿.主要病理改变为全身性血管炎,特别容易侵犯冠状动脉,是儿童及青少年冠状动脉性疾病的主
社交网站现已成为大多数人社会生活中不可或缺的组成部分。在以往文献研究的基础上,本研究旨在考察社交网站使用动机对个体生活满意度的影响以及领悟社会支持和网络自我呈现
本论文首先系统的阐述了长余辉材料、光激励发光材料、光致变色材料以及荧光温度传感材料的发展历史、研究现状和应用前景。通过XRD确认所合成样品的物相,采用稳态与瞬态光谱、漫反射光谱、荧光寿命、余辉衰减曲线、热释光曲线等手段表征材料的发光特性,初步探索了所制备材料在有关方面的应用。主要获得的研究成果总结如下:(1)通过高温固相法成功制备了Eu3+掺杂Sr_3Sn_2O_7红色荧光粉。我们详细研究了该红色
威刚科技,点亮餐饮企业节能低碳之焰  位于苏州工业园区内的威方科技,是全球知名的内存应用产品生产厂商一一威刚集团的子公司,专注于研发、生产与销售LED照明灯具,目前己开发出拥有众多自主专利的室内外LED灯具。威方科技在节能照明产品领域,延续了威刚集团“灵敏、快速、创新、活力”的品牌定位,致力达成“实时应对市场及客户需求,引领产品改革潮流,搜寻一切可能,区分不同需求,打造时尚尖端产品”的品牌精神。 
松辽盆地M区块位于松辽盆地北部中央坳陷区齐家—古龙凹陷内,该区砂体储层厚度为3-5米,断裂和裂缝较为发育,这些长短期发育的断层配合背斜构造,形成了有利的油气富集区。在该