论文部分内容阅读
视频多维描述空间从视频信号描述的角度入手,研究一种全新的适合各种自适应操作的视频信号表达方式,结合现有的自适应技术,实现一种通用的视频自适应解决方案。视频多维描述空间的信息组成分三个层次:信号层次、结构层次和语义层次。人脸是语义层次的信息。本文重点研究语义层次中人脸信息的检测。
与通常的人脸检测算法相比,面向视频多维描述空间的人脸检测对误检率提出了更高的要求。本文提出了一种人脸检测方法,改进了原有的Adaboost算法并对改进后的算法进行级联。现实中的人脸大部分都是非正脸,所以对非正脸的要求较高。研究表明,在人脸样本中加入一定比例的非正脸样本,能够提高对多姿态人脸的检测性能。通过实验可知,非正脸的偏转角度小于15°且占人脸样本比例在15%-20%之间,对多姿态人脸有较好检测效果。特征和样本权重系数是人脸检测的关键。因为检测率和正样本系数相关性大,而误检率和负样本系数相关性大,所以首先设置负样本权重系数稍大于正样本系数。其次排除掉位于边界的和长宽小于两个像素的无效特征,提高参与训练特征的有效性从而加快训练和检测速度。再次,算法的训练非常耗时,训练过程中存储特征对样本的排序数据可节省训练时间。最后,通过实验分析了级联算法中误检率和样本、分类器数量的关系,误检率越低要求负样本和分类器数量越多,而高检测率对应更多的正样本。训练中对各层强分类器的误检率进行动态设置和校正弱分类器的阈值,以改善检测能力。
实验结果表明,搭建的快速人脸检测系统有较好的分类性能并对误检率的降低有明显作用。