面向多测量率压缩感知的并行加速技术及应用

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:LAP281482184
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大规模分布式智能视频监控中,终端摄像头连续不断地向远程服务器发送所采集的视频数据,不仅需要较大的网络带宽和存储空间,而且网络传输延迟较大,面临采样视频压缩的严峻挑战。压缩感知能从基于少量采样点获取的测量值中重构原始数字信号,并在采样过程中完成数据压缩,非常适合于在智能监控终端完成高压缩率的监控视频采集。然而,目前的大部分压缩感知方法采用单一测量率进行压缩感知采样和重构,导致重构质量和采样压缩率的矛盾,即提高重构图像质量则导致采样的压缩率降低,反之,提高采样的压缩率则会降低重构图像的质量。因此,解决现有压缩感知方法存在的这个问题,对于提高压缩感知方法的压缩率性能具有重要的研究价值,同时有助于促进压缩感知方法在大规模视频监控等实际场景中的广泛应用。本研究以解决现有压缩感知方法存在的上述问题为出发点,提出了一种多测量率压缩感知方法,以在重构质量不降低的情况下,减小压缩感知采样得到的测量数据大小。多测量率压缩感知涉及用户感兴趣的目标区域检测、压缩感知采样数据表示、压缩感知采样加速、面向应用的重构性能评估共四个方面的关键问题。其中,用户感兴趣的目标检测采用卷积神经网络来实现,为加速相应卷积神经网络模型的训练和推理,分别研究了 ARMv8多核CPU集群和异构多核集群上的深度神经网络加速方法,最后以端到端行人再识别为例分析半精度多测量率压缩感知方法的有效性。因此,本研究主要探究了如下四个方面的关键技术:(1)提出了一种多测量率压缩感知方法MRCS。MRCS使用设计的单步目标检测网络MYOLO3预测用户感兴趣的目标区域,然后使用不同的测量率对用户感兴趣的目标图像区域以及其他图像区域分别进行采样,以减小压缩感知采样得到的测量数据大小。实验结果表明,MYOLO3是一个网络规模较小的实时目标检测模型,适用于监控摄像机、无人机等计算资源有限的终端设备。MRCS方法通过降低压缩感知测量数据的大小,明显减少了其所需要的网络传输带宽和存储空间。例如,当测量率为0.01-0.25时,MRCS方法在VOC-pbc数据集上的平均压缩比达到了 1.43-11.51。(2)研究了一种在ARMv8多核CPU集群上基于OpenCL加速深度神经网络的方法。为了以透明的方式在多核CPU集群上实现OpenCL并行编程,设计了一个虚拟OpenCL平台模型FTCL。然后,通过将深度神经开发库Darknet移植到基于FTCL的多核CPU集群上,实现了一个并行深度神经网络框架FTCL-Darknet,以有效利用ARMv8多核CPU加速深度神经网络。FTCL-Darknet支持利用基于StridedBatchedGEMM的并行im2col卷积来加速多核CPU上的深度神经网络。实验表明,FTCL在不同数量的多核CPU集群上具有较好的可扩展性。同时,基于 FTCL-Darknet 实现的深度神经网络 YOLOv3、ResNet-152 和 DenseNet-201,在由6个FT-2000plus CPU节点构成的多核CPU集群上,基于MS COCO2014和ImageNet2012数据集的平均数据并行训练与推理性能分别达到了 2.2Image/s和6.4Image/s。(3)提出了一种使用OpenCL在异构多核集群上加速深度神经网络的方法。首先,为异构多核集群设计了统一的、高层次抽象的OpenCL平台模型UHCL和一个支持基于偏好的OpenCL内核动态调度的自适应运行时系统。然后,通过引入深度神经网络的并行优化方法,如基于stridedbatchedGEMM的并行Winogrand卷积算法、基于机器学习的OpenCL内核自动调优等。最后,在异构多核集群上基于UHCL实现了一种并行优化的深度学习框架UHCL-Darknet。实验结果表明,UHCL-Darknet框架在异构多核集群上具有较好的可扩展性和性能可移植性,提高了深度神经网络模型在异构多核集群上进行并行训练和推理的图像吞吐量。(4)面向端到端行人再识别提出了一种半精度压缩感知采样方法HCS4ReID。HCS4ReID采用半精度浮点数进行压缩感知采样和压缩感知测量值的表示,支持使用多种测量率同时对一帧视频图像的不同区域进行压缩感知采样和重构。在PRW数据集上的实验表明,与采用单精度浮点数表示的传统压缩感知采样方法相比,HCS4ReID在Intel HD Graphics 530 GPU上的压缩感知采样达到了 1.55倍的加速比,且传输和存储采样得到的测量数据只需约一半的网络带宽和存储空间。同时,在端到端行人再识别的应用方面,HCS4ReID在重构的PRW数据集上达到了与相应传统压缩感知方法类似的行人再识别准确度。通过上述四个关键技术的研究,构建了一个比较完整的并行多测量率压缩感知技术框架,为在不降低重构质量的同时提高现有压缩感知方法的采样压缩率提供了一种技术解决方案,有助于促进压缩感知方法在大规模分布式图像和视频采样系统中的应用。
其他文献
关联成像(Correlated Imaging)又叫鬼成像(Ghost Imaging),利用光场的二阶乃至高阶关联性质,间接重构出目标,是一种间接成像技术。不同于传统光学成像技术可以利用面阵探测器直接获取目标的图像,关联成像需要通过特定的重构算法计算出目标图像。在关联成像中,照明光被分为两路:信号光照射目标后被无空间分辨力的单像素探测器探测,参考光经自由传播后被面阵探测器探测,任一路都无法单独成
关联成像是一种基于光场高阶相干获取目标信息的成像技术。和传统成像相比,关联成像在诸多方面具有优势。首先,关联成像可实现无透镜成像,在一些透镜难以加工的波段内,如X光,关联成像可更容易地获取物体图像。其次,在关联成像系统中可以用点探测器获取二维或三维物体的图像,和普通的面阵探测器相比,点探测器灵敏度高,这使得关联成像可以在极弱光条件下成像。此外,点探测器读写速度快,也使得关联成像系统可以高速采集数据
多波段光电载荷融合成像具有几何和物理特性共同识别的功能,可有效提升目标识别率和识别效率,在光电成像技术领域发挥着不可替代的作用。传统多波段光电载荷一般选用多镜头分立组合的光学结构,存在系统体积大、图像实时处理能力弱等问题,难以满足对新型光电载荷集成化和灵巧化的需求。伴随着超精密加工技术的发展,多面共体光学元件的形、位高精度加工成为可能,光线可以在不同光学面间多次反射,形成折叠式光学成像系统,并有望
随着装备的快速发展、实战化的使用要求和保障模式的变革,对装备测试诊断提出了更高的要求和更大的挑战,测试模式的变革势在必需,装备测试性工程正是顺应这一变革的产物。当前,一般工程意义上的测试性设计已趋于完善,但针对复杂系统的测试性设计仍存在一些认识上的偏差和未解决的技术流程与关键技术问题,无法满足工程实践需要,如测试性设计中未考虑集成故障和系统级测试,系统级故障诊断隔离难等,为此本文在部委级预研项目的
以癌症为代表的复杂疾病严重威胁人类的生命健康,其形成包含复杂的分子间相互作用和调控过程。以患者临床表现出来的少数几种特征对疾病进行划分,然后对每一类辅以特定的治疗手段往往会在不同个体上有不同的反应,治疗效果难以预测。复杂疾病往往是由遗传因素、环境因素、生活习惯等多种因素之间相互作用导致的,并不遵循孟德尔遗传定律,因而家族病史和遗传相关信息只能说明个体存在患病的概率,但并不意味着就一定会患病,这些都
量子计算作为一种利用量子力学基本原理来完成计算任务的新兴技术,具有经典计算无法比拟的强大计算能力,一经提出就获得广泛关注。尤其在大数质因子分解与Grover搜索等量子算法提出之后,人们更加深刻的认识到量子计算或将为整个信息处理领域的演进与发展带来强劲动力。最近,许多国家颁布了关于量子计算研究的中长期发展规划,不断为该领域的技术实现与应用探索加码提速。作为一项应用广泛的信息技术,数据挖掘旨在从海量数
城市计算是计算机科学以城市为背景,跟城市规划、交通、能源、环境、经济和社会学融合的新兴交叉领域。城市计算的任务,是首先通过感知、获取城市中产生的各类大数据,然后采用高效的数据管理技术、先进的算法以及新颖的可视化技术来分析处理及展示大数据,用以解决城市中存在的诸多问题和挑战,如交通拥堵、空气污染、规划落后等。城市内产生的大数据多种多样,如人或车移动时产生的轨迹数据、各大媒体平台发布的新闻、股市里时刻
随着大数据时代的到来,网络空间的数据资源越来越丰富,其数据量已经远远超出了传统数据分析技术和信息系统的处理能力,寻求海量数据中的有效的信息已成为各领域的迫切需求。知识图谱以其语义网的本质,将客观世界存在的实体、关系、属性等概念以结构化知识的形式连接成庞大的网络,作为人类描述知识的重要载体,为大数据环境下的信息获取提供了便捷快速的解决方法。其中,人物实体作为信息交互的枢纽,往往在寻找目标知识的过程中
当今社会,无线通信为人们打开了俯瞰世界的视野,并逐步成为人们生活中密不可分的一部分。然而,随着社会的不断进步,无线通信的发展面临着诸多挑战。一方面,新兴概念如虚拟现实(virtual reality,VR)、物联网(Internet of things,Iot)、智能制造等的出现对无线通信的吞吐率、延迟、可靠性等方面均提出了新的更高要求。而另一方面,适合无线通信的频谱资源又非常有限。因此,增强对现
面对不断提高的卫星成像分辨率以及快速增加的在轨卫星,天基对地观测卫星系统获取数据的速度和总量都呈爆炸式增长。据报道,我国在轨卫星每天获取的对地观测数据高达数百个TB,而且增长势头强劲,这意味着对地观测大数据时代已经来临。当前,用户对卫星对地观测数据服务提出新要求。在时间分辨率上,用户急需卫星对地观测数据在获取、传输、处理和分发整个流程中的响应趋向近实时化;在空间分辨率上,用户需要卫星图像的分辨率高