基于视觉深度学习和车车通信的车队协同安全系统的设计与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:nishiwangba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着交通行业的不断发展,检测道路上的车辆、行人等移动目标来提高道路驾驶的安全性得到越来越多的重视。近几年,随着深度学习的发展,计算机视觉相关的任务逐渐被深度学习所取代。对于目标检测任务,人们也开始探索利用深度学习的方式来解决。同时移动端设备作为一种无需连入网络的安全隐私计算资源,在其上实现基于深度学习技术的交通目标检测任务成为当下研究的热门话题。本文首先介绍了目标检测算法常用的几大类方法,并分析比较了各类方法的主要内容及优缺点。接着介绍了我们设计的移动端深度学习目标检测架构,主要分了并行处理层、控制层和应用层三级结构,并基于OpenCL的并行多核处理框架完成卷积层、池化层、全连接层和激活函数的实现。由于卷积层计算在整个深度学习计算期间计算量最大耗时最久,我们提出并实现了基于OpenCL内存模型的优化加速方法。对卷积输入和卷积核权重采用多核冗余的方式从全局内存预加载进本地内存和常量区中,并采用避免分支的方法来减少线程工作项的等待时间。在介绍完移动端的目标检测系统后,本文继续介绍基于IEEE 802.1 1p车车通信协议的分布式目标检测系统。采用Map-Reduce模型对卷积层和池化层进行分布式切分,在计算每层过后工作节点交换各自相邻数据。同时我们为了解决分布式系统中的由于不同工作节点计算能力不均而产生的木桶效应,设计并实现了基于指数平滑法来预测计算性能的任务重分配机制。使用指数平滑法预测各工作节点的计算能力,并根据不同的计算能力分配与之对应的计算任务,从而提升整体的分布式计算加速比。最后我们使用2到6个分布式节点进行实验,基于均分法和预测法对比了每一层卷积层的执行时延和整体的加速比。实验表明预测法在2-6个节点的时候加速比比均分法要高,对卷积层加速达到了1.95x-5.94x加速效果,而均分法只有1.69x-5.78x加速效果,在6个分布式节点均分法和预测法在整体加速上呈现性能相似效果,达到3.35x/3.36x的加速效果。
其他文献
乏氧现象广泛存在于实体肿瘤中。乏氧诱导因子-1α(hypoxia inducible factor 1α,HIF-1α)通过参与多种靶基因的转录调控影响肿瘤细胞的能量代谢、增殖和凋亡,使细胞及组织
根据光寻址电位传感器(LAPS)原理,提出一种结合主成分分析和反向传播(BP)神经网络识别溶液味觉的方法。对LAPS电子舌采集的味觉数据主成分进行提取,将该主成分作为BP神经网络的训
目的观察优质护理在小儿肺炎护理中的应用及效果。方法将90例小儿肺炎患儿分成对照组与优质组,每组45例,其中对照组采用常规护理方案,优质组应用优质护理方案,对比观察护理效
基本公共服务现代化是社会现代化的重要内容。当前,我国基本公共服务能力与经济社会发展水平和要求、人民群众日益增长的公共服务需求、发达国家公共服务水平相比,仍有一定差
DNA微阵列技术能够高通量地一次性检测成千上万个基因,这一技术高度自动化、规模化和微型化等特点,使得其可以作为研究肿瘤等复杂性疾病的重要手段。根据肿瘤表达谱数据分析,从
以光的性质为基础的光谱分析技术已经广泛用于各种生产实践领域,但是,对于浑浊介质中化学成分的检测研究,却一直没能得到有效地突破。其主要原因在于浑浊介质中散射粒子的散
<正> 平面几何中如下几个命题都与线段的乘积式有关。相交弦定理圆的弦相交于圆内一点,各弦被这点内分(分点在线段上)成的两条线段的乘积相等。如图1(1)所示,有PA·PB=PC·PD
[目的]观察面瘫汤联合针刺治疗原发性面肌痉挛疗效。[方法]使用随机平行对照方法,将70例门诊患者按随机数字表方法随机分为两组。对照组35例针刺(取阿是穴、百会、患侧翳风、
针对容灾信息系统难以量化和评价的问题,提出了一种通用的容灾信息系统建模方法,设计并实现了容灾仿真系统.基于网络3层架构模型构建了系统仿真模型,采用故障注入技术实现了