基于深度学习的三维目标检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:papalong2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维目标检测是计算机视觉中比较重要的任务之一,在自动驾驶、机械臂抓取、增强现实等领域都有着重要的应用。基于点云的三维目标检测相比图像的二维目标检测更具挑战性,点云的稀疏、不规则等属性对算法的设计提出了更高的要求。本文主要研究基于深度学习的三维目标检测算法,主要研究内容如下:(1)本文提出了一个新的基于点云的三维目标检测方法—Frustum Conv Net(FConv Net)。该方法借助于当前成熟的二维目标检测提供候选区域,使用一种新的点云分组方法——滑动平截头体来聚合局部点特征,将无序不规则的点云转化成规则的特征图,以便后续使用全卷积神经网络。F-Conv Net在室内SUNRGBD数据集和室外KITTI数据集上都取得了不错的结果,超过所有同时期的方法。(2)本文将提出的F-Conv Net的方法扩展到双目视觉设定下的三维目标检测。在这种设定下,只使用两张彩色相机图片作为输入而没有任何深度数据例如激光雷达点云的输入。与现有方法相比,我们提出的方法表现出明显的优势。(3)鉴于当前三维目标检测过于依赖二维目标检测并且二维检测很难检测到被遮挡的物体这一事实,本文在不依赖图像的三维目标检测算法Vote Net上进行改进,提出了点云和特征的二次提取和聚集以实现更好的边界预测。与基准结果相比,本文提出的方法有效地提高了SUNRGBD和Scan Net数据集上3D目标检测的性能。(4)针对Point Net++网络特征提取能力弱的特点,本文设计了一个语义感知的三维目标检测方法,通过将子流形稀疏卷积神经网络UNet预测的语义类别作为每个点的额外输入,在Scan Net数据集上的3D目标检测上取得了极大的性能提升。(5)本文将目标检测拓展到更加精细化的任务——实例分割和全景分割。通过设计的启发式算法来融合目标检测结果和语义分割结果,在Scan Net数据集点云实例分割和全景分割上取得了不错的结果,优于同时期所有已发表的论文工作。
其他文献
微博作为近年来新兴的网络媒介,发展速度之快、规模之大日益受到重视,并广泛作用于各种文学艺术领域。近年来微博影评的兴起,不仅表现出与传统影评迥异的特色,作为网络影评发
<正>微信是腾讯公司于2011年初推出的一款发送文字、图片、语音短信和视频,支持多人语音对讲的手机应用。截至2014年第二季度,微信的月活跃用户数已达到4.38亿。青少年很快接
通过对城市郊区发展形式的全面探讨,深入分析城郊型"农家乐"发展背景及其在促进城郊地区经济发展、加快城市化进程等方面所起的重要作用。就其实际经营过程中突显的经营模式
结合长期施工经验,介绍了PHC管桩静压法施工工艺,针对施工中易出现的问题及质量控制措施进行了详细探讨。
介绍铁路远程教育系统的设计原则和目标,阐述铁路远程教育总体框架结构和铁路远程教育应用系统体系,论述铁路远程教育系统总体网络技术方案。
建筑基坑施工中的逆作法施工,是与常规的施工方式不同的施工方式。具体为,将传统的地下工程施工的施工顺序(顺作法)颠倒,从上往下进行施工工作。首先进行基坑围护结构的以及基
<正>甲沟炎是外科门诊的常见病和多发病,病因较多。①由于不当修甲造成趾甲板或趾甲碎片进入两侧甲周。②穿过紧的鞋、爱运动,脚趾长时间挤压造成脚部血液循环不畅而引起。③
<正>金庸对时事的评论预测,主要依据是确凿资料和有效信息的案头工作,大部分是出于对事物分析的结果。金庸素以武侠小说闻名,盛名之下,遮蔽了他曾经作为报人的经历,特别是为
<正>梅核气是指咽中异物感,如有梅核梗阻,咯之不出,咽之不下为主要特征的咽部疾病[1]。这种咽中异物感多在吞咽动作、尤其吞咽唾液时感觉明显,而进食顺利,常无异常感觉。属祖
肖邦"夜曲"的旋律优美宽广,表达的情感细腻动人,深受人们的喜爱。肖邦"夜曲"的旋律写作充满了技术性,旋律线条通常带有强烈的起伏性,重复手段的使用使音乐的旋律既有变化又有