【摘 要】
:
当前,人工智能技术在科研、医疗、金融、教育、交通等多个领域逐步取得了突破式的进展,已然成为当前科研界,工业界的核心发展方向,同时芯片作为随处可见的各种电子设备中的核心部件,设计一款基于人工智能的多功能芯片也是时势所趋。但当前现有的人工智能芯片在物联网、车载、导航等对能耗要求苛刻的场景上部署困难,因芯片内部功率低则几瓦高则几十瓦,而低功耗芯片又无法运行复杂算法,从而使得其使用范围十分受限。为突破传统
论文部分内容阅读
当前,人工智能技术在科研、医疗、金融、教育、交通等多个领域逐步取得了突破式的进展,已然成为当前科研界,工业界的核心发展方向,同时芯片作为随处可见的各种电子设备中的核心部件,设计一款基于人工智能的多功能芯片也是时势所趋。但当前现有的人工智能芯片在物联网、车载、导航等对能耗要求苛刻的场景上部署困难,因芯片内部功率低则几瓦高则几十瓦,而低功耗芯片又无法运行复杂算法,从而使得其使用范围十分受限。为突破传统芯片体系结构对深度学习技术在计算能力与能量消耗上的瓶颈,专用集成电路依靠其强大的运算能力、先进的制造技术以及与CPU、GPU完全不同的处理器体系结构,可对神经网络计算实现大幅度的加速,并有效降低功率消耗。所在实习单位的芯片团队提出基于可重构阵列架构的深度学习神经网络人工智能处理器设计,本项目致力于拓展现有处理器的可编程能力,通过指令集、神经元计算单元、输入输出系统与存储系统的定制设计实现对循环网络中长短期记忆网络(LSTM)的实时、高效部署。该长短期记忆神经网络模块的设计能够拓展智能芯片在边缘计算中的应用领域。为实现该网络模块,在本项目中使用软件Matlab进行建模和性能分析,Py Torch框架实现网络搭建和网络训练推断,以获取训练完成网络中的数据和权重参数进行量化处理后,用于支持之后的FPGA验证测试工作。同时根据LSTM网络算法设计搭建LSTM特有状态机,并将该网络部署到整个芯片网络中。在本项目中提出一种基于可重构配置的数据流处理器设计,该处理器根据不同神经网络内核调整数据流的控制模式来调配不同功能模块和片上片下存储单元。并提出将16个神经元计算单元4分复用与控制核结合的长短期记忆神经网络架构设计,在只配置片上RAM存储时,与GPU相比降低了三个数量级的功耗,仅用30m W到50m W左右。项目中使用Modelsim作为仿真工具,Vivado工具作为开发平台,采用自顶向下的设计思想和模块化设计方法,为使得芯片支持高速算法和能够处理神经网络大型数据集,设计搭建DDR IP核完成逻辑综合布局布线后得到仅约1W左右的片上功耗。并使用Kintex-7系列XEM7350开发板根据训练网络数据和配置链参数实现对所设计硬件电路进行验证分析。本项目设计模块实现将长短期记忆神经网络模块并入可重构芯片设计中,提出设计采用4分复用方法有效提高神经元计算单元利用率,提高计算效率,降低功耗。采用片上片外存储增强存储灵活性,并研究发表可重构数据流处理器相关论文专利以支持多种神经网络进行模块可重构配置,实现数据流可重构目标。
其他文献
当前我国电信业正面临量收不匹配,收入增长乏力的情况。2019年提费降速仍在持续,携号转网已全面实施。面对政府监管和市场竞争激烈的环境,电信运营商的收入压力将更为严峻,因此必须加快转型步伐,培育新的业务增长点。ICT即信息通信技术(Information and Communication Technology,简称ICT),是将信息技术与通信技术融合后向客户提供综合信息服务,能够较好地满足客户个性
本论文以医用Ti49.2Ni43.8Cu7合金为研究对象,采用电化学方法在其表面构建了多孔结构并在其内部原位沉积了含有羟基磷灰石和抗菌银离子的生物功能复合涂层,系统考察了该生物功能涂层的制备工艺对Ti49.2Ni43.8Cu7合金表面形貌和表面性能的影响,为设计开发兼具抗菌功能和生物活性的医用钛合金表面处理技术提供理论指导和实验参考,具有良好的临床应用前景。阳极氧化研究结果表明,医用Ti Ni C
随着信息技术的蓬勃发展和互联网用户日益增长,庞杂的网络数据使得有效信息的采集和组织愈发困难。网络新闻作为信息传播的主要媒介,既是政府、企业等机构进行价值展示,理念表达的重要方法,也是社会民众参与公共生活,关注社会发展的主要渠道。如何将大量无序网络新闻数据进行提炼,快速准确的挖掘其中有价值的内容是目前信息处理所面临的一大挑战,而话题检测与追踪(Topic Detection and Tracking
六价铬Cr(Ⅵ)毒性高,流动性强,易在土壤和地下水中迁移扩散,严重威胁人类和其他生物的健康。渗透式反应墙(PRB)是一种具有广阔应用前景的原位修复技术,利用PRB修复Cr(Ⅵ)污染土壤和地下水是目前国内外最常用的一类方法。填料的选择是PRB技术的关键,零价铁因成本低、无二次污染等特点,在PRB技术中广泛应用。但实践表明,运行后期,零价铁表面会覆盖铁氧化物发生钝化而导致活性降低,影响项目的正常运行。
现代汉语偏正结构“V_双+N_双”指由双音节动词做修饰语、双音节名词做中心语组合而成的一种名词性结构。因其具有“动词直接做定语”的独特构造形式、“同形异构”的丰富语义表达以及“句法与词法中间站”的特殊句法功能,长期以来在汉语语法研究中占有重要地位。以往研究主要是对现代汉语偏正结构“V_双+N_双”的结构类型及其应用进行积极的探索,然而,对此类结构中“V_双”做定语时的词类性质和语法功能仍存在不少争
现阶段对于《最高人民法院关于适用<中华人民共和国公司法>若干问题的规定(四)》第九条所规定的实质性剥夺具体构成条件的研究相对缺失,这种缺失在某种程度上助长了在实务判决中对相关内容说理的匮乏,进而降低了解决纠纷的效率,在一定程度上削弱了司法公信力。虽然该条司法解释仅仅是规定在查阅权的适用上,但“实质上剥夺了”等说法在实务中早就已经广泛存在于多种股东权利的纠纷中了。针对这种状况,本文采用实
由于新闻报道受到严格的监管,并且具有可靠的来源,但是要从大量新闻文本数据中获取出有价值的信息是困难且低效的。因此,通过一定方法获取新闻文本数据中的新闻主题,并将新闻数据所包含的内容清晰全面地呈现给用户,是一个重要的研究课题。当前流行的文本主题识别方法主要是基于概率主题模型,该模型在文本主题识别方面取得了很好的效果,但是对于传统的LDA(隐含狄利克雷分布)模型进行新闻文本主题识别时面临三个主要问题:
随着人民法院办公信息化水平的提高,信访系统的建设,综合了现有的信访、立案和电子档案等部门的信息资源,成为进一步加强社会治安建设的重要工作。信访系统及时准确地反映了
未来随着更多用户设备接入到无线网络中,频谱资源短缺问题变得日益严峻,于是具有高频谱效率和高系统容量的非正交多址接入(Non-Orthogonal Multiple Access,NOMA)技术应运而生。然而,更多用户的接入将会导致严重的信息传输安全问题,未经授权的第三方用户可以利用无线信道的广播特性来窃取有价值的信息。研究表明,物理层安全(Physical Layer Security,PLS)技
中国的音乐教育体系已经比较先进,但对于盲童钢琴教育上还相对空缺,本文主要通过对世界著名音乐教学法的整合与应用,针对盲童寻找适合他们的教学方法。盲童钢琴教学中仍存在很多问题与挑战,其中包括盲童的乐理知识学习,双手协调把握,键盘的精准弹奏,盲谱的学习。本文将对盲童的心理现象做出分析后给予相应的教学建议,通过专业的训练后盲童在钢琴领域的学习将变的更加容易。盲童在学习音乐过程中是一种探索与发现的过程。本课