论文部分内容阅读
随着网络及信息技术的不断发展,三维模型大量产生,其识别及检索技术逐渐引起了学术研究者以及众多行业研究部门的高度关注。目前,深度学习算法在计算机视觉领域中取得了巨大的进展,特别是在图形图像识别、自然语言处理以及语音辨认等领域。本文借鉴基于深度学习的其他多媒体信息的识别及检索方法,考虑将深度学习技术运用到三维模型的分类识别及检索中。主要工作如下:采用基于投影的方式来提取三维模型的形状特征:首先需要对三维模型进行规范化处理,即平移,旋转和缩放。然后提取三维模型的三视图投影视图,再将模型的三视图投影视图经过去均值和预白化,划分组块等处理,转化为深度学习网络可识别的形式作为网络输入。提出了一种改进的稀疏降噪自编码网络三维模型识别方法,该方法采用一种改进的无监督和受限的拟牛顿计算方法相结合的稀疏降噪自编码模型来建造深度神经网络,从而对三维模型信息进行深层次加工处理,进而对三维模型进行分类识别。提出了一种基于拓扑稀疏编码的三维模型识别方法,该方法采用一种改进的无监督特征学习算法的拓扑稀疏编码模型来构建深度神经网络,并用贪婪算法对网络模型的代价函数JsA),(进行迭代优化,学习权值矩阵A并输出可视化特征A。从而有效改善了常用的稀疏自编码模型提取特征时间长等弊端。提出了一种权值优化深度卷积网络,同时计算三个侧面投影图的卷积网络,并将该网络应用到三维模型的识别及检索中,实验表明了该方法的有效性。