使用卷积网络估计三维形状的正朝向

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cynthializzu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多数三维物体都有一个自然向上的朝向,我们称之为正朝向。将物体摆正到其正朝向是一个重要的问题。首先,它有助于物体的识别。而且,这也是物体匹配、检索、形状分析等许多图形学问题中的第一个步骤。另外,这也有助于生成具有高识别度的物体预览图,来帮助三维形状数据库的管理。然而,由于各种各样的原因,现有数据库中的许多模型都没有处在其正朝向。本文提出了一种基于机器学习的方法,使用三维卷积网络来预测物体的正朝向。当给定足够量的三维物体及其正朝向的方向向量时,该预测问题可以建模为回归问题。本方法借助于深度网络的学习能力,可以处理一般性的三维物体,而不需要对其形状做对称性、平行性等假设。除了网格模型外,本方法还可以处理能够被体素化的其他种类的数据,例如隐式曲面和点云。与基于卷积网络的方法相比,过往方法的劣势在于它们受限于其预先假设的规则。但是,这些规则并不总是成立。因此,基于学习的方法更适用于一般的物体。尽管已有工作中已经使用了数据驱动的方法,但是其学习过程基于人工设计的稳定性、可见性和平行性等特征,这些特征对一般物体的正朝向估计并不适用。相比之下,神经网络通过端到端的学习方式,直接从原始数据中提取高层知识,而不依赖于物体的对称性等正规性质。但是,单一的卷积网络难以对一般的物体都起作用。核心问题在于,每种物体的正朝向有其特殊的性质。这种情况在机器学习中被称为干扰现象,会导致泛化能力不足。也就是说,应该使用不同的策略来处理不同品种的物体。因此在本文提出的系统中使用了分治的方法。对于每一个形状,首先通过一个网络对其分类,然后才将它传入在对应品种上训练的正朝向回归网络进行预测。另外,本文使用了基于距离的聚类方法来减少所需网络的个数,以及测试中增强的方法来提高准确率。丰富的实验展示了本方法的有效性和高效性。本系统在测试集上达到了90%以上的正确率,并对训练集以外的物体品种具有一定的泛化能力。并且实验表明本系统可以处理一些其它方法无能为力的情况。此外,利用本方法处理一个模型,平均时间不超过0.15秒,比现有方法高效得多。因此更方便应用于机器人学任务等需要即时反馈的问题。
其他文献
加密是保护信息安全的一种直接而有效的重要手段,同时也是信息隐藏应用中不可或缺的一项重要的预处理技术。与文本信息不同,图像等多媒体数据具有数据量大、存在内在联系等一
学位
随着网络技术和多媒体处理技术的发展,在线数据库、付费有线电视、CD/DVD版权的管理与分发和卫星电视等多媒体业务有着越来越广泛的应用,大量数字内容需要通过网络进行传输,
在传统的手工文献检索中,科技文献的标引和检索都是人工完成的。随着电子文献的增多,手工处理文献已经显得力不从心,为了对大量的文献进行自动处理,从文献的标引到检索都要用
有限元方法是在有限维空间中求解偏微分方程数值解的很重要的方法,我们经常使用多项式空间来逼近有限维求解空间。但当节点自由度较多时,多项式空间的维数就比较高。这样就会
竞争失效是产品的一种重要失效模式。在现有的文献中,对于竞争失效数据的分析大部分都假设产品的失效机理是独立的。为了反映和评价产品失效机理的相关性,本文用二维Gumbel c
无线传感器网络是一种由大量的集成传感、数据处理和短距离无线通讯功能的传感器节点组成的以数据为中心的无线自组织网络,其目的是协作地感知、采集和处理网络覆盖区域中各