基于单目视觉的3D目标检测算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:erdongzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域基本任务之一。目前存在的2D目标检测算法可以给出目标在RGB图像中的矩形边界框和相应类别。但2D目标检测具有局限性,无法满足生活在三维世界中人们的特定需求。3D目标检测会给出目标的3D边界框,在某些应用场景如自动驾驶、机器人领域、三维场景重建等发挥着重要的作用。单目相机相较于其它传感器具有价廉、易获取等特点,所以仅仅基于单目视觉完成3D目标检测具有潜在的商业价值和深远的研究意义。本文的主要研究内容和贡献如下:本文将3D目标检测任务拆分成几个子任务,包括2D目标检测模块、维度预测模块、旋转角预测模块、几何约束模块。每一个子任务负责估计3D目标检测涉及到的特定参数。从而将一个复杂的问题分解成几个较简单的子问题,联合各子问题的解便得到原问题的解。(1)本文提出了一种基于交并比(Intersection over Union,IoU)的维度预测损失函数。本文将计算矩形边界框IoU算法扩展到三维空间,提出了针对维度预测场景下的计算3D边界框IoU的算法。与传统的损失函数将预测的每个维度分量单独计算误差相比,基于IoU的损失函数考虑边界框所有属性的内在联系,且具有尺度不变性特点。(2)本文提出了一种间接预测目标旋转角的策略。基于单目视觉实现3D目标检测仅仅提供了 RGB图像信息,而目标旋转角与目标在RGB图像中的外观无直接的联系。为此本文选择预测局部旋转角并通过几何关系计算出最终需要的目标旋转角。(3)针对基于单目视觉完成3D目标检测任务时目标深度信息获取困难的问题,本文依据几何约束原理,通过最小二乘法计算出目标相对于观测者的位置坐标。同时本文提出一种优化网络,对目标位置坐标进行修正。结合2D目标检测,维度和旋转角预测结果完成最终的3D目标检测任务。实验阶段以多个指标对本文提出的3D目标检测算法性能进行评估,结果表明与其他检测算法相比本文提出的算法有更高的检测精确度。
其他文献
教师的专业发展是个永恒的话题.结合作者多年的切身体验,将教师专业发展划分为职业、专业、事业三个阶段,深入剖析了三阶段的不同特点与内在的联系,分析了贯穿三个阶段不同层次与内涵的学习理念.强调时代在变革,教师和学生都在与时俱进,领悟和驾驭变中之不变的规律,这才是教书育人的本质和精髓.
文本细粒度情感分析作为自然语言处理领域中的一项重要任务,其研究目的在于从互联网中有价值的评论文本信息中挖掘诸如产品、服务、事件等细粒度元素,并对相关细粒度元素进行情感判别。目前细粒度情感分析已经广泛应用于社交网络、电商服务、舆情分析等方面,从中展现了它巨大的价值。近年来,深度学习的不断发展,为细粒度情感分析提供了 一系列的解决方案,虽然这些方案取得了不错的效果,但是在计算复杂性以及模型大小上都大大
在驾驶过程中,常常会出现因为道路环境中物体的阻挡,使自动驾驶汽车感知不到前方具体的交通状态,从而发生交通事故的情况。因此,为解决避免前车遮挡和其他盲区导致的决策失误或延迟,自动驾驶汽车在进行驾驶决策的时候,需使用前车或路侧获得的认知信息辅助决策。现有的多车协同决策的端到端算法主要依赖大量的标记数据进行联合训练,但是并没有充分挖掘多源数据之间的关系,使得端到端决策算法的效率和可解释性不高。针对这一问
近年来,第五代移动通信技术(5G)和物联网技术(Internet of Things,IOT)得到了快速发展,为用户提供实时、快速、高精度的定位服务以及可靠、连续的导航服务是当前和未来通信网络关键且必备的基础能力。全球卫星导航系统(Global Navigation Satellite System,GNSS)在室外及空旷场景下拥有非常好的定位性能,能够满足大多数用户的需求。但是,在遮挡物繁多且复