论文部分内容阅读
在大规模分布式智能视频监控中,终端摄像头连续不断地向远程服务器发送所采集的视频数据,不仅需要较大的网络带宽和存储空间,而且网络传输延迟较大,面临采样视频压缩的严峻挑战。压缩感知能从基于少量采样点获取的测量值中重构原始数字信号,并在采样过程中完成数据压缩,非常适合于在智能监控终端完成高压缩率的监控视频采集。然而,目前的大部分压缩感知方法采用单一测量率进行压缩感知采样和重构,导致重构质量和采样压缩率的矛盾,即提高重构图像质量则导致采样的压缩率降低,反之,提高采样的压缩率则会降低重构图像的质量。因此,解决现有压缩感知方法存在的这个问题,对于提高压缩感知方法的压缩率性能具有重要的研究价值,同时有助于促进压缩感知方法在大规模视频监控等实际场景中的广泛应用。本研究以解决现有压缩感知方法存在的上述问题为出发点,提出了一种多测量率压缩感知方法,以在重构质量不降低的情况下,减小压缩感知采样得到的测量数据大小。多测量率压缩感知涉及用户感兴趣的目标区域检测、压缩感知采样数据表示、压缩感知采样加速、面向应用的重构性能评估共四个方面的关键问题。其中,用户感兴趣的目标检测采用卷积神经网络来实现,为加速相应卷积神经网络模型的训练和推理,分别研究了 ARMv8多核CPU集群和异构多核集群上的深度神经网络加速方法,最后以端到端行人再识别为例分析半精度多测量率压缩感知方法的有效性。因此,本研究主要探究了如下四个方面的关键技术:(1)提出了一种多测量率压缩感知方法MRCS。MRCS使用设计的单步目标检测网络MYOLO3预测用户感兴趣的目标区域,然后使用不同的测量率对用户感兴趣的目标图像区域以及其他图像区域分别进行采样,以减小压缩感知采样得到的测量数据大小。实验结果表明,MYOLO3是一个网络规模较小的实时目标检测模型,适用于监控摄像机、无人机等计算资源有限的终端设备。MRCS方法通过降低压缩感知测量数据的大小,明显减少了其所需要的网络传输带宽和存储空间。例如,当测量率为0.01-0.25时,MRCS方法在VOC-pbc数据集上的平均压缩比达到了 1.43-11.51。(2)研究了一种在ARMv8多核CPU集群上基于OpenCL加速深度神经网络的方法。为了以透明的方式在多核CPU集群上实现OpenCL并行编程,设计了一个虚拟OpenCL平台模型FTCL。然后,通过将深度神经开发库Darknet移植到基于FTCL的多核CPU集群上,实现了一个并行深度神经网络框架FTCL-Darknet,以有效利用ARMv8多核CPU加速深度神经网络。FTCL-Darknet支持利用基于StridedBatchedGEMM的并行im2col卷积来加速多核CPU上的深度神经网络。实验表明,FTCL在不同数量的多核CPU集群上具有较好的可扩展性。同时,基于 FTCL-Darknet 实现的深度神经网络 YOLOv3、ResNet-152 和 DenseNet-201,在由6个FT-2000plus CPU节点构成的多核CPU集群上,基于MS COCO2014和ImageNet2012数据集的平均数据并行训练与推理性能分别达到了 2.2Image/s和6.4Image/s。(3)提出了一种使用OpenCL在异构多核集群上加速深度神经网络的方法。首先,为异构多核集群设计了统一的、高层次抽象的OpenCL平台模型UHCL和一个支持基于偏好的OpenCL内核动态调度的自适应运行时系统。然后,通过引入深度神经网络的并行优化方法,如基于stridedbatchedGEMM的并行Winogrand卷积算法、基于机器学习的OpenCL内核自动调优等。最后,在异构多核集群上基于UHCL实现了一种并行优化的深度学习框架UHCL-Darknet。实验结果表明,UHCL-Darknet框架在异构多核集群上具有较好的可扩展性和性能可移植性,提高了深度神经网络模型在异构多核集群上进行并行训练和推理的图像吞吐量。(4)面向端到端行人再识别提出了一种半精度压缩感知采样方法HCS4ReID。HCS4ReID采用半精度浮点数进行压缩感知采样和压缩感知测量值的表示,支持使用多种测量率同时对一帧视频图像的不同区域进行压缩感知采样和重构。在PRW数据集上的实验表明,与采用单精度浮点数表示的传统压缩感知采样方法相比,HCS4ReID在Intel HD Graphics 530 GPU上的压缩感知采样达到了 1.55倍的加速比,且传输和存储采样得到的测量数据只需约一半的网络带宽和存储空间。同时,在端到端行人再识别的应用方面,HCS4ReID在重构的PRW数据集上达到了与相应传统压缩感知方法类似的行人再识别准确度。通过上述四个关键技术的研究,构建了一个比较完整的并行多测量率压缩感知技术框架,为在不降低重构质量的同时提高现有压缩感知方法的采样压缩率提供了一种技术解决方案,有助于促进压缩感知方法在大规模分布式图像和视频采样系统中的应用。