论文部分内容阅读
目前,人脸检测的算法大都是基于图像的人脸检测算法,不是基于视频的人脸检测算法。视频是一个图像序列,对于一个有语义的运动物体(例如行人)来说,视频不但包含运动物体空间位置的信息,也包含运动物体时间位移的信息。因此,基于视频的行人人脸检测算法不但应该利用行人人脸在每帧图像中空间位置的信息,也应该利用行人人脸在相邻帧之间时间位移的信息。本论文研究基于视频的行人人脸检测算法,提出一种基于运动分析的行人人脸检测算法和基于运动估计的行人人脸跟踪算法。
基于图像的人脸检测算法需要用一个大小变化的窗口搜索图像的每一个角落(或者等价地,固定窗口的大小,改变图像的尺寸),以便确定人脸区域。显然,这种算法无法适应基于视频的人脸检测要求。本论文提出一种基于运动分析的行人人脸检测算法。这种算法首先利用运动分析的方法检测行人(特定的运动物体),然后计算人体重心并根据人体重心确定人脸区域,最后利用肤色模型和模板匹配的方法在人脸区域中检测人脸。由于行人的面积大于其脸部的面积,加之行人在相续各帧中有运动信息可寻,因此,先检测行人后检测人脸比直接检测人脸容易。另外,本论文的方法能够适应人脸大小的变化,不必在搜索窗口大小的选择上费思量。
基于视频的入脸检测算法包括检测和跟踪二个部分。目前,许多运动物体的跟踪算法都是先对每帧进行运动物体的检测,然后在相邻帧之间进行运动物体的匹配。这样做必须对每帧的每个象素点都进行前景点和背景点的甄别,消耗大量的计算资源。本论文采用视频编码中运动估计的方法进行人脸跟踪。运动估计的方法本身具有较强的实时性,加之行人行进速度有限,在帧间时隙内位移不大,因此,运动估计搜索范围很小,速度更快。另外,被运动估计跟踪的人脸区域必是前景区域,从而当视频中有新的人脸出现的时候,可以减少前景点和背景点甄别的范围。采用该算法对一些视频中序列图像的人脸进行检测与跟踪,得到了良好的效果。