论文部分内容阅读
让计算机视觉系统自动定位图像中的物体和区分物体类别,使其具备简单的分类决策能力是本文研究的出发点。主要研究内容包括学习方法的改进、分类器的设计、视觉物体检测和视觉类别识别四个方面。 (1)在AdaBoost学习框架下,引入生成式、判别式和多参照点聚类三种模型改变训练样本的空间分布,从而研究三种弱分类器学习方法。 AdaBoost是一种组合多个弱分类器为一个高度精确强分类器的加法模型,基于重新分布的训练样本构造弱分类器是其核心之所在。在详尽分析推导AdaBoost算法基础之上,本文从生成式、判别式和多参照点聚类三个角度研究弱分类器的学习,从而提高其性能。生成式模型以正例样本集的高斯拟合形式实现。判别式模型通过最大化类间散布和类内散布的比值,寻求两类分类的最佳Fisher投影方向。在基于多参照点聚类的模型中,首先依据训练样本聚类出k个参照点,然后采用四种量度计算每个训练样本到k个参照点的距离,从而重新分布样本空间。 (2)从分类器合并的角度,研究PIS-POS策略来构造五种似然函数分类器,借助“词集合”模型的思想研究体现多分支决策的树状分类器构造方法。 合并分类器目的是挖掘驻留在各种分类器中的信息,AdaBoost强分类器依据加法模型合并多个弱分类器,Viola和Jones利用纵向组合强分类器的思想构建了层叠分类器。在层叠分类器基础之上,为充分利用强分类器的层次信息和众多弱分类器的实数值输出,本文研究PIS和POS两种策略分别从横向和纵向组合分类器实现联合决策,从而构造出PIS-CA、PIS-EA、POS、S-PIS-POS和A-PIS-POS五种似然估计分类器。为实现多分支决策,本文借助“词集合”模型的思想,引入树状结构组合多个强分类器,其中非叶子节点挖掘了不同类别间的共性信息。 (3)基于变换域内模板区域的直方图特征集,利用生成式和判别式两种弱分类器学习方法,构建物体检测范畴的两个层叠结构人脸检测系统。 作为一个两类分类问题,区分出物体出现的区域和背景区域是视觉物体检测的目的,本文以人脸检测作为其实现载体。在AdaBoost学习框架下,用Intensity、LoG/DoG和Gabor三个滤波器组获取人脸在变换域内不同尺度和方向的时空特性,通过统计模板区域的直方图构建人脸的边缘分布,从而形成用于人脸检测的新特征集。然后利用生成式模型(高斯拟合方法)和判别式模型(Fisher线性判别方法)分别学习弱分类器并构造两个层叠结构的人脸检测系统。 (4)用感兴趣区域、SIFT区域描述符、参照点中心以及距离量度共同刻画物体类别,利用多参照点聚类方法学习弱分类器,以树状分类器的构造策略合并分类器,从而研究视觉类别识别方法。 视觉类别识别指在多个不同的视觉类别间进行彼此区分。首先利用六种感兴趣区域检测器获取训练图像中包含的所有感兴趣区域,再通过类内层的滤波和类间层的组合两个步骤提取重要的感兴趣区域,然后计算感兴趣区域的SIFT特征,再用多参照点聚类的方法学习弱分类器,最后依据词集合的思想构建视觉类别识别树。树的非叶子节点体现了一“袋”类别共享特征的情况,从根节点到叶子节点的唯一路径表示一个视觉类别。 总之,本文通过改进AdaBoost学习中的弱分类器学习,研究模式识别领域新的分类器设计方法,构造了视觉物体检测和视觉类别识别两类计算机视觉系统。