论文部分内容阅读
静态图像中的人体姿态估计是给定检测图像后根据行人检测的结果确定人体不同部件的位置并得出方向、尺度信息,是后续行为理解的基础。由于人体自身的灵活性加上背景的复杂性,使得人体姿态估计问题极具挑战性。常用的特征有形状特征和方向梯度直方图(Histogram of Oriented Gradient,HOG)。人的形状特征会随着姿态的变化而不断改变,又容易受到服饰的影响,而HOG特征计算复杂。对于一幅图像,事先并不知道部件的位置,加上人体的姿态千变万化,所能采取的姿态极多,使得姿态搜索空间非常大。为了解决部件特征提取和姿态所搜索空间过大问题,本文的主要创新成果有:1.针对模型本身在部件特征表达上的不足限制了姿态估计结果准确度的问题,提出了一种基于图结构模型(Pictorial Structure,PS)和新型纹理特征的人体姿态估计算法。采用改进后的外观模型,训练获得部件位置的先验知识,联系相邻部件之间的配合关系,并将其应用于测试图像的外观模型建模阶段。应用Haar型LBP(HLBP)纹理特征,提取部件的纹理信息,对图像进行分块处理,并为每一块赋予不同的权重。实验结果表明,带权重的HLBP(Weighted HLBP,WHLBP)特征能更有效提取部件的纹理特征,与HLBP特征、归一化HLBP特征和颜色特征相比能获得更高的准确度。2.针对姿态估计过程中姿态搜索空间过大的问题,提出了一种基于简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)超像素算法的Grab cut减小姿态搜索空间算法。以行人检测矩形框作为输入,用SLIC算法分割得到超像素并用超像素作为s-t图中的节点构建图模型,分别为前景和背景超像素建立混合高斯模型(Gaussian Mixture Model),迭代更新高斯参数,用最小割算法完成图像前景提取。后续的姿态估计过程仅在得到的前景区域中进行。实验结果表明,基于SLIC的Grab cut算法与基于Grab cut算法的减小姿态搜索空间算法相比在运行时间上和姿态估计准确度上均有较大程度提升。综上所述,本文在静态图像的人体姿态估计任务中的两点创新具有优异的性能。对彩色图像分块提取纹理信息,根据特征值的大小设置不同的权重,致力于解决部件特征提取问题。同时为了尽可能的减小姿态搜索空间,通过超像素分割算法将姿态推断局限于小面积的前景区域,能同时提高运行速度和姿态估计准确度。