【摘 要】
:
目标检测技术是计算机视觉领域的研究热点之一,它的根本任务是检验图像中是否存在感兴趣的一个或多个目标以及预测目标的位置和类别。近年来基于卷积神经网络的目标检测算法在检测速度和检测精度方面都获得了很大提升,已经逐步替代了传统目标检测算法。深度卷积神经网络包含大量卷积计算,异构计算的出现使得高性能计算技术高速发展,为卷积神经网络中大量的卷积计算的执行速度提供了性能保障。OpenCL是在异构系统下实现对不
论文部分内容阅读
目标检测技术是计算机视觉领域的研究热点之一,它的根本任务是检验图像中是否存在感兴趣的一个或多个目标以及预测目标的位置和类别。近年来基于卷积神经网络的目标检测算法在检测速度和检测精度方面都获得了很大提升,已经逐步替代了传统目标检测算法。深度卷积神经网络包含大量卷积计算,异构计算的出现使得高性能计算技术高速发展,为卷积神经网络中大量的卷积计算的执行速度提供了性能保障。OpenCL是在异构系统下实现对不同厂商处理器进行统一编程的通用计算语言。本文对基于卷积神经网络的目标检测算法YOLOv3的并行化方法进行了研究,使用OpenCL对其实现了并行化加速,主要成果有:(1)使用并行化设计方法,将OpenCL的并行编程框架与YOLOv3模型相结合,对YOLOv3模型中的所有类型的网络层都进行了并行化设计,根据不同网络层的算法,对每个网络层的OpenCL内核函数进行了精细化设计,通过实验设置合理的OpenCL NDRange空间,相对于CPU串行实现方法,各网络层基于OpenCL的并行设计方法的速度性能在GPU Titan XP上实现了几十到几百倍的提升,YOLOv3模型整体实现了357倍的高加速比。针对YOLOv3模型中最为耗时的卷积计算部分,本文设计了分块矩阵乘法内核,该内核充分利用GPU上可以快速访存的局部内存和私有内存。该内核使用向量加载、合并访存、循环展开等方法优化指令流,合理设计工作项和工作组,提高了多线程的并发性,从而提高了GPU的计算资源的利用率。优化设计的OpenCL矩阵乘法内核,在GPU上计算大规模矩阵乘法时,相对于CPU有几千倍的性能提升,相对于在GPU上直接计算单个结果矩阵元素的OpenCL内核,速度提升4~8倍。(2)对基于Winograd算法的卷积并行加速方法进行研究,针对计算资源有限的CPU平台,本文使用OpenCL并行化方法在CPU上实现了Winograd算法的并行化,相对于串行实现的Winograd卷积方法,在相同的CPU上速度性能提升了几十倍。为减弱输入特征图通道数对Winograd算法并行化加速性能的影响,将Winograd算法与矩阵分块乘法相结合,将Winograd卷积过程中逐通道进行的乘加计算转换为矩阵乘法,使加速性能更加稳定,整体加速效果更好。
其他文献
随着我国东部地区高速铁路网络建设的完善,国家开始大力建设中西部地区高铁线路。我国中西部地区地形复杂,高山峡谷众多,路线多以桥隧段为主。为了解决存在桥隧相连段的车隧气动效应问题,本文提出了通过在隧道洞口浅埋地段来修建减压通道以缓解列车进入隧道产生的空气动力学效应的措施并展开研究。采用理论分析、动模型试验以及数值模拟相结合的方法,对设置有减压通道后的车隧气动效应规律进行了研究。基于FLUENT计算软件
本文主要运用了文献法、调查法、比较法进行研究。英语自主学习具有能动性、独立性和异步性的特征。自主学习是实现教育终身化的关键,是实现教育民主化的体现,顺应了当前的社
大肠癌是世界上第三大常见肿瘤,其死亡率在人类肿瘤中占第三位,近年来的发病率呈上升趋势。近几年国内外学者在大肠癌的筛查、诊断、靶向治疗方面的研究有了很大进步,但是患
目的动脉出血,出血量大且血流湍急,极易造成患者死亡。壳聚糖和海藻酸钙为常用医用止血敷料,但目前上市此类产品仅对于小血管效果明显,对于大动脉的出血往往效果不佳。将两者
随着全球科技的不断进步,以科技为主题的国际交流座谈会也越来越多,同时随着事故的不断发生,人们对于黑匣子的关注也越来越多。对于来自不同国家的观众来说,交替传译就成为了极其重要的辅助,对提升观众的会议体验以及交流有着很大的影响。本口译实践报告,通过以释意理论为指导,以《科技研究:打开黑匣子》交流会的视频作为材料,完成英汉交替传译实践,并分析实践过程中存在的问题、出现的原因以及解决措施。本口译实践报告结
随着科学技术的快速发展,互联网的规模不断扩大,网民数量日益增加。如何保护用户的信息安全,一直是网络安全领域中一个值得深入研究的问题。网络异常行为检测能够在早期发现
黄曲霉毒素B_1(Aflatoxin B_1,AFB_1)与呕吐毒素(Vomitoxin,DON)是农作物中较为常见,毒性较强的真菌毒素。花生、玉米作为我国乃至全球重要的粮食作物,在生长、收获、储藏、加工过程中如果处理不当,极易受AFB_1、DON等真菌毒素的侵害,严重危害人类和动物的生命健康。因此,对这类真菌毒素的降解一直是近年来的研究热点和难点。现有的针对AFB_1、DON的物理、生物和化学降
铝是人体非必需元素,近年来越来越多的研究表明,高浓度存在的铝离子对生命体和环境均会带来极大的危害;而锌离子作为生物体内第二大含量较高的微量元素,摄取过量或缺乏都会对