判别式分类模型中的关键算法研究

被引量 : 0次 | 上传用户:QiuWK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从理论层面和实际应用层面对判别式分类模型中的关键算法进行了分析和研究。在理论层面,本文针对传统最大间隔判别式分类器中存在的问题,提出了最小K最大损失准则。与常用的最小最大损失准则相比,最小K最大损失准则能够提高分类器应对分类边界附近噪声时的鲁棒性;与传统的Hinge Loss相比,最小K最大损失能够让用户指定需要考虑的最差样本的个数K。本文对有CNK(N为训练样本数量)个约束条件的原始优化问题进行了等价变换,使最小K最大准则能够通过含有2N个约束条件的优化问题来描述。这样的等价变换保证了最小K最大损失算法的求解效率。该准则分别在线性分类器、非线性分类器和半监督分类器中进行了部署:通过在13个开源数据集上的测试实验,该准则的有效性得到了验证。在实际应用层面,本文通过设计判别式分类器,解决多标签和多实例分类问题。作为人机交互中最基本的一种方式,面部表情识别技术已经在众多多媒体系统中得到了应用。然而,在此前的研究工作中,每一张面部表情图片只用一个情感状态来描述,这把面部表情识别问题给过分简化了。因此,为了更加有效和直观地描述表情,本文采用多标签分类的思路来处理表情识别问题,即用C(C≥1)个事先定义的情感状态来共同描述某个面部图片的表情。本文在最大间隔分类模型框架中融入面部表情识别领域的先验知识,从而利用特定的判别式分类器,在多标签表情识别的应用中获得了很好的分类性能。统计颜色模型能够估计图像中正类和负类像素点的颜色分布从而实现基于颜色特征的像素分类,其在肤色检测等众多图像和视频处理问题中被广泛应用。但在使用统计颜色模型之前,需要完成如下于工标记步骤:(1)整幅标记,根据一个图片是否包含正类区域,将其分为正类图片或者负类图片;(2)区域标记,对于正类图片,细致标记正类区域。其中的区域标记,极其耗费时间和精力,使得统计颜色模型很难被方便地应用。因此,本文提出利用整幅标记的结果直接进行颜色分布估计,即把正类图片中的所有像素作为正类的训练样本,把负类图片中的所有像素作为负类的训练样本。采用这样的策略,正类训练样本中将混杂着相当数量的负类样本,而负类训练样本本身将是纯净的,这正对应着机器学习中的多实例问题。然而,当前常用的多实例学习方法不能解决统计颜色模型所面临的海量训练样本的问题。本文通过判别式混合高斯模型实现分布估计并通过实验验证了该方法的可行性,从而利用判别式分类器解决了实际中的多实例问题。
其他文献
二十世纪初,顾颉刚先生开辟了孟姜女故事研究的新纪元,受此影响,文学界展开了轰轰烈烈的孟姜女故事研究活动。孟姜女故事宝卷是孟姜女故事的一个非常重要的组成部分。上个世
目的为临床安全、合理应用复方半边莲注射液提供参考方法对复方半边莲注射液保留灌肠佐治小儿急性支气管肺炎的临床效果进行比较分析结果利用复方半边莲注射液保留灌肠治疗小
目的探讨护理标识在神经外科重症监护室中的应用效果。方法本院神经外科重症监护室于2009年1-12月采用护理人员标识、病人身份标识、血型标识、管道标识、药物标识、提示标识
随着信息产业的飞速发展,数据存储的介质、所处的系统环境各异,这就使得不同应用系统之间交流数据很难进行。数据交换平台的提出,正是为了解决异构环境之间的信息交换,也就是
本文以仿人机器人踢足球为例,以现实机器人为原型,利用Solidworks建立了仿人机器人的三维机械结构模型,利用ADAMS和Simulink联合仿真的方法,仿真得到了机器人踢足球的整个过程,利
肉羊养殖业是一项传统而又前景广阔的产业。近几年来,随着我国经济社会的发展,人民生活水平的提高,人们对畜产品的消费需求结构正在发生变化。国际国内羊肉供求矛盾突出,羊肉
"体育学困生"是指在体育品德和运动能力等方面的发展水平与体育教学不相适应,完成不了体育学习任务的学生。"体育学困生"并不存在智力或者身体素质上的障碍,只因他们缺乏学习
维生素D是维持骨骼肌肉工作性能的必需物质,摄入足够的维生素D可减少机体骨密度低、肌肉萎缩、应力性骨折等风险。机体维生素D水平对运动员的健康和运动能力影响较大。不同训
介绍了尼龙66盐的产品特性、应用领域、主要原料和生产工艺,对该产品的国内外市场情况进行了分析和预测。
面向农作物产量监测对中高分辨率遥感数据光合有效辐射(photosynthetically available radiation,PAR)反演的实际需求,该文选择山东省禹城市2014年1月至2014年12月共13景GF-1/W