论文部分内容阅读
静态图像中的人体姿态估计是指在输入图像中检测人体的各个部位,如头部、躯干、四肢等,并输出这些人体部位的位置和角度等参数的过程。静态图像中的人体姿态估计属于中层视觉问题,在估计的过程中需要综合利用图像的颜色、边界、梯度等低层的图像特征信息,同时还要考虑几何视觉,动力学约束等人体部位之间的分布关系。但是由于人体姿态的变化范围很大,同时还存在自遮挡,人体颜色和尺度差异等难点,再加上图像中的背景干扰,使得静态图像中的人体姿态估计的研究是一个具有挑战的课题。同时,由于人体姿态估计的结果可以作为计算机理解和分析人类行为的基础信息,所以人体姿态估计在智能监控、人机交互、人体运动捕捉等领域有着广泛的应用前景。本文提出了一种基于姿态聚类和人体部位候选重组的人体姿态估计算法。与已有的单一全局PS模型的方法不同,为了增加人体部位检测的区别性同时使模型能够适用于各种不同的姿态,本文的算法对人体的姿态进行了聚类处理,聚类后的姿态在类别内具有相似的部位外观和人体部位空间位置关系,使得检测模型更加准确,而不同的姿态类别适用于不同姿态的检测。为了确定待检测的样本的姿态类别,我们引入了多元线性回归算法。通过对待测样本在每个姿态类别下的最佳检测概率进行加权平均,确定待测姿态所属的类别。另外,为了克服最佳估计结果中存在的个别人体部位误检和人体姿态估计中尚未很好解决的重复计数问题,我们提取了与待测图像姿态最匹配的模型下的检测结果中概率最大的几组姿态作为人体各部位的候选,并在这些候选的基础上,重新构造代价函数,定义约束条件,对这些候选进行重新的组合,通过整数线性规划求解目标函数,以获得最佳的姿态估计结果。本文在公开的具有挑战的人体姿态估计LSP数据库上进行了实验,实验的结果表明,与已有的方法相比,本文所提出的算法在人体各个部位的检测准确率以及总体姿态估计准确率上都有显著的提高。同时实验也证明了本文所提出的姿态预聚类的有效性,以及约束条件下的候选重组能够在一定程度上克服重复计数问题。