论文部分内容阅读
长久以来,由于3D模型有着巨大的应用空间,所以在计算机视觉等众多领域中获取人们现实生活中的3D模型是一个十分必要的任务。而真实人体的数字3D模型反应了人体的三维形貌特征等具体细节,相对于其他物体较难获取,是一种我们更为需要的数据。真实人体的数字3D模型也称作计算机人,和真实的物理人体体模相比较,它更加安全、灵活和便捷,并且容易在计算机中进行可视化和存储、控制调节等。而且无线体域网的各种实验研究均可以使用它进行,目前无线体域网的技术发展并未完全成熟,这样使得无线体域网的发展得到了促进。医疗监护中将利用计算机技术进行人体模型的三维数字可视化应用到生物机械学分析和人体动作仿真,来分析人体肩部关节运动的复杂性。如今可以方便快捷的获取物体特别是人体的3D信息的深度相机如Kinect等引起了一股巨大的研究浪潮。 论文第一步先通过Artec/Kinect对不同睡眠姿态下的人体进行数据获取,获得到了不同姿态的人体的3D模型,模型中包含了海量的点云数据,即人体模型表面海量的特征点等,其会导致获得的这些人体三维点云数据之间多多少少有些重复的特征信息,所以同时进行了一些去掉孤立点、噪声点等简单的预处理。第二步利用视觉相似度,将三维空间中的特征提取问题转化为对二维空间中形状特征的提取问题,其中二维空间特征的集合包含了模型的所有三维几何特征。即采用了光场描述符对3D数字模型进行信息特征获取,该方法对模型退化、噪声干扰以及模型形变均具有较好的鲁棒性。通过建立投影坐标系统,从位于大的正多面体(空间上包含整个3D人体数字模型)表面的照像机位置提取深度图像。由于上述获得的图像中含有丰富的信息,我们采用了相应的特征提取算法得到其中的细节信息。通过尺度不变特征变换(Scale-invariant feature transform,SIFT)算法提取出每一幅深度图像的尺度和旋转不变特征包,该特征包向量中包含了位置、尺度、旋转不变量、视角变化、仿射变换等信息;通过硬聚类算法(k-means clustering)将上一步得到的尺度不变特征变换特征进行聚类并编码成可见的视觉词汇(visual words),并利用视觉词汇构成词袋(bag of words),其需要采用一种好的问题真实模型的逼近学习模型来进行学习。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,其获得了最好的推广能力(或称泛化能力)。它在非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。所以论文接着又研究了金字塔匹配直方图交叉核的支持向量机,并采用该方法对词袋模型进行了学习训练识别,为以后人机交互、无线体域网和医疗监控领域的研究奉献一点力量。