论文部分内容阅读
人体运动的视频分析作为计算机视觉方面的一个研究热点,已广泛应用于智能监控、新一代人机交互、体育运动分析以及虚拟现实等研究领域。由于单目视频数据来源广泛,各种电影、体育运动和舞蹈都以单目视频的形式存储,因而基于单目视频的运动跟踪与分析成为当前研究的一个重要方向。在单目视频中,人体运动目标从三维投影到二维会造成深度信息丢失,因而仅从单目视频恢复三维运动姿态是一件十分困难的事情,研究工作极富挑战性,吸引了越来越多的研究者的关注。本文在总结和分析国内外相关研究工作的基础上,针对视频对象分割、基于单目视频的人体运动跟踪、三维姿态恢复和重构等方面进行了研究。其主要研究内容和取得的成果如下:1.提出一种利用先验概率模型及粒子滤波进行视频分割的算法在传统的背景减除来提取运动目标的方法中,在背景像素值分布服从高斯模型并按照3σ规则进行图像分割时,虽然能够很好地提取背景,但在前景的像素值分布与背景的像素值分布有重叠的区间时,会产生将前景误分割为背景的现象。因此本文算法通过粒子滤波及先验概率模型对下一帧中的运动目标进行预测,根据预测值得到一个自适应分割阈值而进行视频对象分割,从而降低了分割结果中前景点误分割为背景点的概率。2.提出一种从二维图像恢复人体关节三维坐标的算法在没有先验知识的情况下,从二维图像恢复对应的三维坐标是一个病态问题。比例正交投影在满足一定的约束条件下,可以重构出人体关节的相对三维坐标。由于比例正交投影只是真实投影的近似,因而由该方法重构出的人体关节三维坐标与真实值偏差较大。本文在透视投影模型下建立了人体关节的三维相对坐标值估算方法,采用逆运动学获得各关节的旋转欧拉角。与传统算法相比,该算法具有无需摄像机标定、对人体运动没有特别约束、使用简单和人体关节三维坐标估算精确等优点。3.提出一种适用于单目视频的无标记人体运动跟踪方法在现有的无标记单目视频运动跟踪方法中,由于深度信息丢失,一般只能从视频中跟踪出人体的二维坐标信息,而不能进行三维运动跟踪。另外,由于缺少显著的特征标记,现有方法很难进行长序列人体运动跟踪。针对这一现象,提出了一种基于形变外观模板匹配进行单目视频的三维人体运动跟踪算法。算法的创新在于:1)利用正向运动学及逆向运动学得到二维图像上某一候选关节点对应的形变外观模板,通过模板匹配从二维视频中恢复人体三维运动姿态;2)采用层次化方法来恢复人体三维运动姿态,其最优三维人体运动姿态采用局部搜索获得,能够进行长序列人体运动跟踪。4.提出一种基于H-anim标准下的三维人体动画显示方法根据VRML中H-anim标准对虚拟人进行几何建模。在虚拟人文件导入过程中,利用有限状态机(FSM)对文件进行解释,为便于虚拟人的显示及控制,以树型数据结构表示虚拟人几何数据,完成了一个用于三维虚拟人动画的开发包VHASDK。在VHASDK的基础上提出了一种利用视频跟踪数据驱动进行三维人体动画的方法,该方法生成的人体动画逼真、成本低,能够应用于虚拟现实、计算机游戏、动画制作等领域。