论文部分内容阅读
本文从理论层面和实际应用层面对判别式分类模型中的关键算法进行了分析和研究。在理论层面,本文针对传统最大间隔判别式分类器中存在的问题,提出了最小K最大损失准则。与常用的最小最大损失准则相比,最小K最大损失准则能够提高分类器应对分类边界附近噪声时的鲁棒性;与传统的Hinge Loss相比,最小K最大损失能够让用户指定需要考虑的最差样本的个数K。本文对有CNK(N为训练样本数量)个约束条件的原始优化问题进行了等价变换,使最小K最大准则能够通过含有2N个约束条件的优化问题来描述。这样的等价变换保证了最小K最大损失算法的求解效率。该准则分别在线性分类器、非线性分类器和半监督分类器中进行了部署:通过在13个开源数据集上的测试实验,该准则的有效性得到了验证。在实际应用层面,本文通过设计判别式分类器,解决多标签和多实例分类问题。作为人机交互中最基本的一种方式,面部表情识别技术已经在众多多媒体系统中得到了应用。然而,在此前的研究工作中,每一张面部表情图片只用一个情感状态来描述,这把面部表情识别问题给过分简化了。因此,为了更加有效和直观地描述表情,本文采用多标签分类的思路来处理表情识别问题,即用C(C≥1)个事先定义的情感状态来共同描述某个面部图片的表情。本文在最大间隔分类模型框架中融入面部表情识别领域的先验知识,从而利用特定的判别式分类器,在多标签表情识别的应用中获得了很好的分类性能。统计颜色模型能够估计图像中正类和负类像素点的颜色分布从而实现基于颜色特征的像素分类,其在肤色检测等众多图像和视频处理问题中被广泛应用。但在使用统计颜色模型之前,需要完成如下于工标记步骤:(1)整幅标记,根据一个图片是否包含正类区域,将其分为正类图片或者负类图片;(2)区域标记,对于正类图片,细致标记正类区域。其中的区域标记,极其耗费时间和精力,使得统计颜色模型很难被方便地应用。因此,本文提出利用整幅标记的结果直接进行颜色分布估计,即把正类图片中的所有像素作为正类的训练样本,把负类图片中的所有像素作为负类的训练样本。采用这样的策略,正类训练样本中将混杂着相当数量的负类样本,而负类训练样本本身将是纯净的,这正对应着机器学习中的多实例问题。然而,当前常用的多实例学习方法不能解决统计颜色模型所面临的海量训练样本的问题。本文通过判别式混合高斯模型实现分布估计并通过实验验证了该方法的可行性,从而利用判别式分类器解决了实际中的多实例问题。