论文部分内容阅读
随着万物互联时代的到来,智慧城市和无人驾驶等众多新型应用场景逐渐涌现,对延迟的要求愈发苛刻,边缘计算应运而生。深度神经网络在新型应用场景中应用较多,其计算需要消耗大量的资源,但边缘设备的计算、存储等资源受限,难以直接在边缘设备中部署深度模型。因此,我们从两个方面进行研究,一方面将原始网络压缩为变为轻量级网络,降低对资源的需求量,并引入早期退出机制,使得计算可动态调整;另一方面使用多台边缘设备分布式计算深度神经网络,降低单台设备的计算负载,加快计算速度。针对以上问题与挑战,本文基于研究现状,研究面向边缘智能的神经网络计算方法,主要工作和创新点如下:首先,针对计算场景中仅有单台边缘设备,本文设计了深度神经网络按需计算方法Edge KE,在资源受限的边缘设备上实现资源消耗和推理性能之间的平衡。利用知识蒸馏压缩神经网络,降低计算资源的需求量,利用早期退出技术为神经网络提供灵活的计算方式,以按需方式优化模型执行,满足不同的性能要求,包括面向时延的推理方法和面向精度的推理方法。在不同时延和精度要求下,测试多种边缘设备,实验结果表明,Edge KE优于原始模型,当推理精度仅比原始网络低0.16%时,不仅计算延迟降低了1.83x-2.51x,而且内存占用也减少了2.42x。还验证了Edge KE能够有效地满足不同的推理性能要求,在各种延迟约束下,精度损失在4.75%以内,在各种推理精度要求下,加速比可达3.71x,在推理性能和资源消耗之间取得良好的平衡。其次,针对计算场景中存在多台可协同计算的边缘设备,本文设计了深度神经网络分布式计算方法Edge MI,在异构的边缘集群上实现深度神经网络的分布式计算。提出了时间预估模型,用于预测深度模型的卷积层和全连接层的计算时间;设计卷积计算任务划分方案,降低边缘设备空闲等待时间、高效利用边缘集群的计算资源,加快计算速度;最后,设计数据调度策略,降低边缘设备之间数据交换频率。在边缘集群上测试深度神经网络分布式计算,实验结果表明,Edge MI优于传统的解决方案,其计算速度提升14.34%;数据调度策略使得计算速度提升1.07x-1.22x;当边缘节点数量从2到4,深度模型的加速比达到1.84x-3.57x。