面向边缘智能的神经网络计算方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:xrong19730911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万物互联时代的到来,智慧城市和无人驾驶等众多新型应用场景逐渐涌现,对延迟的要求愈发苛刻,边缘计算应运而生。深度神经网络在新型应用场景中应用较多,其计算需要消耗大量的资源,但边缘设备的计算、存储等资源受限,难以直接在边缘设备中部署深度模型。因此,我们从两个方面进行研究,一方面将原始网络压缩为变为轻量级网络,降低对资源的需求量,并引入早期退出机制,使得计算可动态调整;另一方面使用多台边缘设备分布式计算深度神经网络,降低单台设备的计算负载,加快计算速度。针对以上问题与挑战,本文基于研究现状,研究面向边缘智能的神经网络计算方法,主要工作和创新点如下:首先,针对计算场景中仅有单台边缘设备,本文设计了深度神经网络按需计算方法Edge KE,在资源受限的边缘设备上实现资源消耗和推理性能之间的平衡。利用知识蒸馏压缩神经网络,降低计算资源的需求量,利用早期退出技术为神经网络提供灵活的计算方式,以按需方式优化模型执行,满足不同的性能要求,包括面向时延的推理方法和面向精度的推理方法。在不同时延和精度要求下,测试多种边缘设备,实验结果表明,Edge KE优于原始模型,当推理精度仅比原始网络低0.16%时,不仅计算延迟降低了1.83x-2.51x,而且内存占用也减少了2.42x。还验证了Edge KE能够有效地满足不同的推理性能要求,在各种延迟约束下,精度损失在4.75%以内,在各种推理精度要求下,加速比可达3.71x,在推理性能和资源消耗之间取得良好的平衡。其次,针对计算场景中存在多台可协同计算的边缘设备,本文设计了深度神经网络分布式计算方法Edge MI,在异构的边缘集群上实现深度神经网络的分布式计算。提出了时间预估模型,用于预测深度模型的卷积层和全连接层的计算时间;设计卷积计算任务划分方案,降低边缘设备空闲等待时间、高效利用边缘集群的计算资源,加快计算速度;最后,设计数据调度策略,降低边缘设备之间数据交换频率。在边缘集群上测试深度神经网络分布式计算,实验结果表明,Edge MI优于传统的解决方案,其计算速度提升14.34%;数据调度策略使得计算速度提升1.07x-1.22x;当边缘节点数量从2到4,深度模型的加速比达到1.84x-3.57x。
其他文献
用于锅炉的离心式送风机的滚动轴承常因轴承温度过高而失效,本论述分析了送风机运行过程中,引起送机风轴承温度过高的原因,结合原来设计结构上的不足,介绍通过采用润滑油外置
目的:本课题主要通过观察101例痰瘀互结证慢性阻塞性肺疾病急性加重期(AECOPD)患者应用加味导痰汤联合穴位贴敷治疗,观察治疗前后中医治疗疗效、客观评价其安全性,为进一步探索
随着信息技术的发展,各种新媒体手段层出不穷,对于传统报纸新闻来说是挑战也是机遇。新事物的出现必然导致旧事物的变革或者灭亡,新媒体的出现使报纸新闻逐渐与信息媒体融合
机器人同时定位与制图—SLAM(Simultaneous Localization and Mapping)与传感器紧密相关,具有精度高、速度快、效率高的激光雷达在实现仓储搬运机器人自主运动的相关算法中得到
大米蛋白(RPs)是一种来源丰富、营养均衡的植物蛋白质资源。但较高的谷蛋白含量(>80%)导致其溶解度低下,商品化程度不高。常规的RPs改性过程复杂,且改性效率有待进一步提高,
<正> 近年来国外对植物抗逆性与脯氨酸关系的研究日益重视。通常情况下植物体内游离脯氨酸的含量很低,但在逆境(旱、热、冷、冻) 条件下,脯氨酸含量可猛增数十倍至百倍。植株
近年来,“一带一路”国家经济快速发展,并且世界经济快速增长的重要推动力。然而,传统的经济发展模式使得资源过度消耗,生态环境严重恶化。高速的经济增长并没有促进福利的同
由于其特殊的结构和良好的物理化学性质,石墨烯作为一种环境友好的润滑添加剂而备受关注。通过溶液剥离法合成了石墨烯。利用包括拉曼光谱仪和X射线光电子能谱仪等在内的多项
毕业设计是高校工科本科学生完成专业基本训练、实现培养目标、全面提高人才素质的重要过程,也是检验学生实践能力及研究能力的重要环节。本论述结合实践经验提出改善毕业设