【摘 要】
:
深度学习作为人工智能中的关键技术,已成功用于解决各种2D视觉问题,基于深度学习的三维物体识别技术在自动驾驶和机器人等许多3D视觉领域的广泛应用,也逐渐引起了越来越多的关注。通过各种先进的3D扫描仪可以直接获取到日常生活场景中三维物体的表面点云,但由于点云的无序结构,使得神经网络处理点云时面临着独特的挑战。近年来,研究者们提出将点云转化成其他表示形式来解决该领域的不同问题,如渲染成多视角二维图像或者
论文部分内容阅读
深度学习作为人工智能中的关键技术,已成功用于解决各种2D视觉问题,基于深度学习的三维物体识别技术在自动驾驶和机器人等许多3D视觉领域的广泛应用,也逐渐引起了越来越多的关注。通过各种先进的3D扫描仪可以直接获取到日常生活场景中三维物体的表面点云,但由于点云的无序结构,使得神经网络处理点云时面临着独特的挑战。近年来,研究者们提出将点云转化成其他表示形式来解决该领域的不同问题,如渲染成多视角二维图像或者体素化成规格的栅格,取得了许多出色的成果。高精度、高效率以及较低的计算资源需求一直是评估三维物体识别方法性能好坏的主要指标。尽管现有技术获得了出色的成效,也留下了许多问题需要进一步探索解决。例如,基于二维图像的方法目前虽然在Model Net40数据集上取得了最优性能,但其丢失了三维物体的几何结构;基于体素的方法受限于三维卷积的巨大内存占用和计算量;基于点云的方法需要考虑点云的无序性,非结构化和空间姿态任意的特点。本文在探索和分析了基于深度学习的三维物体识别之后,致力于寻找一种新的三维物体表征方式,其形式简洁,从而可以精简网络架构;又具有强大的表征力,能反映出低分辨率下物体的结构化信息,提高同分辨率下的分类精度。同时,对于体素表示方法的三维物体分类网络普遍分类精度不高且推理速度慢的问题,本文设计了一种快速的级联分类网络,同时满足高精度与高效率的需求。本文的主要工作如下所示:1.提出了一种新的三维物体表征方式。与以往方法使用点云、体素或多视图图像作为深度神经网络的输入不同,本文所提出的方法从有向距离场(SDF,Signed Distance Field)中构造了一类更具代表性的特征,称为空间填充球。由于空间填充球具有比表面点云更强的形状表征能力,不仅可以利用少量的填充球来完成分类任务,而且还可以设计相比于Point Net具有更少层和参数的轻量级分类网络。在数据集Model Net40上的实验结果表明,本文提出的空间填充球表征方式在Point Net分类实验上明显优于同样分辨率的表面点云,在所设计的轻量级网络上也能获得与其相当的分类精度。2.对于三维物体体素表示的情况,本文分析了二值体素不适用于三维卷积的原因并验证了SDF体素能有效提高低分辨率体素用于简单网络的分类精度。为了同时提高神经网络的分类准确性和推理速度,本文设计了一种级联三个不同深浅分类器的混合分类网络,有针对性地处理“简单”、“中等”和“困难”样本。该网络通过对不同阶段分别设置分类阈值来平衡三级分类器的优缺点,在Model Net40测试集上获得了92%的识别精度,且平均推理时间只需0.3ms。
其他文献
图像作为一种极为重要的信息载体,其质量直接影响着人们了解与传播信息。特别在医学领域,医生的诊断情况与图像质量紧密相关,因此对医学图像进行去噪处理是必要的。以肺部CT图像的去噪处理为例,其要求在去除噪声的同时要对原始图像中的病灶等信息进行完好的保留,而传统图像去噪算法在这方面还存在一定的不足。相较之下,基于小波变换的图像去噪方法是一种更先进的技术,其中小波阈值去噪是最常用的方法之一。人工免疫系统(A
针对煤矿井下掘进机器人位姿感知精度低、远程监控效果差及智能控制难度大等问题,通过分析机器视觉在煤矿掘进机器人中的应用情况,从掘进机器人位姿视觉检测、远程视频监控、数字孪生驱动控制和智能协同控制等方面进行深入探究,提出煤矿掘进机器人位姿视觉测量原理和方法,结合远程视频监控技术,实现对掘进机器人地面远程控制,并对其应用效果加以分析与总结。同时,为进一步提升掘进机器人智能化程度和远程控制可靠性,利用数字
在机器人视觉系统中,如何对带有旋转的运动物体进行快速准确检测和轨迹预测具有很重要的研究意义以及应用价值;乒乓球机器人自上个世纪80年代以来就吸引大量研究者深入研究,在当下的技术背景下,随着AI技术的发展,对乒乓球机器人的研究具有更广阔的前景。本文聚焦于乒乓球机器人的视觉系统,以旋转乒乓球为研究对象,深入探讨深度学习在乒乓球机器人视觉系统中的可行性,并且在七自由度库卡机械臂实物系统中进行验证。本文制
家居服作为现代人日常休闲生活中所必备的服装,日益受到人们的关注。随着人们生活水平的提高,人们对于家居服面料的天然、舒适、环保性有了更高的要求。目前国内家居服市场中,存在一些问题。例如,面料、风格等方面较为单一,缺乏自主创新,对于家居服研究关注较少。同时,木棉纤维具有天然、超细、高中空、吸湿导湿、防菌防螨等特性,是一种绿色环保的天然纤维素纤维,可以将木棉纤维用于家居服的面料设计中,为家居服的设计开发
多智能体系统问题中一个主要的研究方向就是一致性控制问题。本文主要关注的是多智能体系统的采样一致性控制问题和定时一致性控制问题。实际应用中,由于计算机控制系统的广泛运用,这使得采样控制策略逐渐成为工业生产中的一种重要控制手段,并且在很大程度上取代了传统的机械式控制手段,因此本文首先对多智能体系统的采样一致控制做出了研究。其次,考虑到定时控制策略在估计系统稳定时间上的优越性,即稳定时间与初始状态无关,
21世纪以来,服装行业的竞争日趋激烈,以计划驱动的标准化、规模化的生产模式已不能满足消费者多样化需求,服装企业正不断向小批量订单式生产转型以适应需求变化、缩短产品生命周期、提升库存周转率,这对服装制造业生产管理水平提出更高要求。目前企业在进行服装大规模个性化定制时,面临交期不确定、订单响应速度不及时、车间柔性化程度不高等问题,在生产过程中瓶颈排除不及时,生产进度难以控制导致无法准时完成订单任务,亟
乙酰乙酸基团是一种有机合成中常用的高反应活性基团。它可以和多种常见的官能团进行反应,比如烯胺化反应、迈克尔加成、多组分反应、酶促聚合、金属络合等,从而得到不同的功能性产物。纤维素作为分布最广泛、应用最悠久的可再生天然高分子,具有极高的利用价值和发展前景。通过酯化反应将乙酰乙酸基团接枝到纤维素骨架上,再进行二次衍生,可以轻易地实现对纤维素的各种改性,进一步拓展纤维素的应用领域。本论文分别使用生物酶催
在当今信息化时代,如何快速并且准确地从互联网海量的信息资源中获取自己所需要的信息显得十分重要,于是个性化推荐系统应运而生。电子商务是近年来比较火热的一个行业,个性化推荐系统在电商平台上的应用被广泛关注。大多数推荐算法的研究都依赖于显式评分数据,然而电商平台中丰富的隐式反馈数据信息蕴藏着巨大的推荐价值,近年来,面向隐式反馈的推荐算法研究也越来越热门,其中有学者提出了一种个性化推荐模型:贝叶斯个性化排
随着网络时代的快速发展,网民们可以在不同的生活网站上针对各种各样的商品发表自己独特的评论,也可以在社交网络中针对某一社会现象提出自己的见解。用户发表的文本评论信息中包含着很多带有情感倾向的语句,这些语句经过整理与研究分析后,对商品和社会等相关领域具有很高的研究价值。因此文本情感分析作为自然语言处理研究的子领域,在过去几年中受到了广泛的关注。方面级别的情感分类是情感分析中的一项细粒度的工作,与传统情