论文部分内容阅读
随着图像、视频生成工具的不断普及,图像、视频的数量呈现爆炸式增长,单纯的依靠人力获取图像、视频中的信息已经不能满足实际的需求。近年来人们对图像以及视频的智能分析、识别的需求越来越大。而如何通过算法自动分析、计算、识别图像以及视频中的信息成为研究的热点。最近10年人体姿态估计作为计算机视觉的子领域吸引了广大研究者的关注。人体姿态估计在现实环境中拥有广泛的潜在应用:动作识别,安全监测,动画生成等。人体姿态估计的研究重点有:表示图像或视频的信息的特征描述符的选择;关节或者人体主要的部位的定位方式;姿态估计方法的选取,基于模型的方法还是基于机器学习的方法。近几年,研究者更多的关注基于单帧静态图像的人体姿态估计的研究,基于视频的人体姿态估计的研究比较少,尤其是基于单目视频序列。但是基于单目视频序列的全身人体姿态估计拥有广大的潜在应用需求。本文主要研究基于单目视频序列的二维全身人体姿态估计。首先,对于视频序列中的每一帧图像我们使用了基于方向梯度直方图为特征向量的线性支持向量机分类算法检测出人体区域,然后在检测区域使用基于最小二乘法的多维迭代回归算法估计出二维全身人体姿态。在研究中,我们根据人体的关节结构构造了全身关节关系树,关系树将人体的全身姿态估计分解为多个局部姿态估计,提高了估计的准确性。在学习训练阶段,对于关节关系树中每一条边训练一个多维迭代回归映射模型,并且采用空间和时间维度相结合的特征作为学习的输入特征向量,关节关系树中父子节点之间的归一化偏移量作为目标特征向量。我们使用方向梯度直方图作为空间特征向量。并且通过引入光流场和帧间差分与方向梯度直方图整合成运动特征来提高姿态估计的性能。根据关节关系树结构,最终我们训练了一个层级回归映射模型。测试阶段,我们使用训练获得的层级回归映射模型估计出人体所有的关节位置。由测试结果可知,我们提出的基于单目视频序列的二维全身人体姿态估计方法取的了不错的估计效果。