论文部分内容阅读
近年来,基于卷积神经网络(CNN)的方法在图像检测和识别领域取得了巨大的成功。随着交通采集技术的日益发展,采集设备每时每刻都会产生海量的交通图片数据。如何从这些海量的图片数据中提取出有价值的信息,实现数据的“增值”并以此来改善交通情况,提高交通管理水平,已成为交通领域亟待解决的一个难题。现有的图像识别方法通常先定位目标所在区域,分割有效信息,然后识别它们。在被识别的交通图像中,许多图像都具有一定的上下文感知信息,它们位置通常是固定的,且不需要重复识别相同的分割信息,例如车牌号的识别等。由于基于CNN的方法是计算密集型和资源消耗型的,很难在嵌入式系统中部署,如智能交通系统、自动驾驶汽车和智能城市等应用。且对于加速神经网络计算,以往的研究只关注卷积层的加速,而忽略了网络中的其他计算。因此,现有的方法只能加速卷积计算,但不能加速整个网络。同时在交通数据的存储分配过程中,由于传统策略没有考虑到数据的热冷问题,使得数据没有得到合理地分配,从而导致数据的读写效率低,进而影响整个交通系统的性能。针对以上问题,本文对比目前最先进的目标检测模型,并结合深度学习的异构加速技术,从优化目标检测流程和加速计算两个方面入手,提出了一种基于上下文信息的感知识别神经网络加速器(CSCA)。优化后的目标检测流程依据上下文信息,首先定位检测信息所在区域,随后通过有效信息分割后比对,避免对相同信息进行重复识别。在计算过程中,CSCA将三元权重与池化层和激活层的筛选能力结合起来,将卷积计算中资源消耗最大的乘累加计算,使用加法计算替代,并在池化激活后还原精度。使得CSCA在保证检测精度的前提下减少无效乘法和激活运算,加快了识别的计算速度。针对卷积神经网络的硬件部署困难问题,本文从卷积计算单元、计算处理单元、计算阵列三个方面为CSCA进行了体系结构的有效设计,并在Xilinx公司的Zynq Ultra Scale+MPSo C zcu102评估板上对CSCA进行了部署与系统实现。最后通过实验验证了该加速器对加速交通图片处理的有效性。