大边际分类模型中的快速算法与理论分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Alkaid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是机器学习的一个基本问题。大边际原理是设计分类算法的重要思想。以大边际原理为基础的支持向量机(SVM)已成功的应用于二分类,多分类,和更一般的层次化分类中。本文主要关注基于支持向量机的分类器设计,针对高维分类任务中的特征选择和层次分类问题,提出了快速算法和理论分析。首先,本文调查了支持向量机中特征选择的发展现状,回顾了相应的正则化技术,重点关注了双正则化支持向量机(DrSVM)模型。DrSVM模型可以在选择重要特征的同时保留相关度高的特征,有利于构造较优分类器。因此,大量研究工作聚焦于DrSVM模型的有效求解方法。然而,已有算法的计算复杂度均严重依赖于数据维度,无法有效处理高维分类任务。在前人工作的基础上,本文针对DrSVM模型,提出了高维数据下的快速算法。本文重新表述了相应的目标函数,并试图在其中应用乘子交替方向迭代求解方法。由于乘子交替方向迭代求解方法的内外双层迭代可能导致较高的计算代价,本文提出了一种单层迭代算法,从而使计算复杂度从O(nd2)降低为O(K(n3+nd)+n2d),其中K为迭代次数,n为样本个数,d为样本维数且d>>n。理论推导表明,本文提出的算法具有全局收敛性。其次,作为二分类和多分类的推广,本文研究了层次化分类问题。现在有许多模型和算法针对层次化分类,例如构造局部分类器,贝叶斯方法和层次化支持向量机(支持向量机在层次化分类中的推广)等。其中层次化支持向量机是当前使用最多的方法,因为它是全局分类器且能够保证分类层次间的一致性。层次化支持向量机的求解一般是转化为二次规划问题,从而利用二次规划问题的通用求解方法。然而,在层次分类任务中,输出空间的高维度提升了二次规划的规模。因此,通用算法计算代价极大。本文基于大边际原理,将层次化分类的支持向量机转化为最大最小优化问题,提出了一个称为硬感知器的算法(HP)。为提高预测精确度,本文构造了一个随机感知器(SP)算法,它是离线算法。该算法避免了层次化支持向量机非常多的约束所带来的计算上的代价。本文证明了如果数据集是可分的,那么经过有限步迭代之后,随机感知器将以很大的概率产生一个次优解。对于大样本和高维数据,本文设计了核形式的随机感知器(KSP),减少了计算复杂度。对于不可分的真实数据,KSP算法的实验结果达到了与层次化支持向量机相同的预测精度,并在运行时间上优于层次化支持向量机方法。
其他文献
切换系统作为一类特殊的混合系统,它是由若干个子系统和协调子系统之间进行切换的切换律组成。因为理论和应用的价值,切换系统越来越受到研究者的重视,它在许多的工业领域也有广
张庆祥教授认为,"胃痛"的发生和发展主要由于"内"和"外"两方面因素,胃失和降或胃气郁滞则发为"胃痛"。胃为阳土,喜润恶燥,为"仓廪之官",且以通为用,以降为顺,故胃气郁滞不畅,
苹果绵蚜Eriosoma lanigerum(Hausmann)是我国重要的检疫性害虫,主要为害苹果、海棠等苹果属(Malus Mill.)植物。目前,该种害虫已在我国一些苹果主产区迅速扩散,并给我国的苹
作为一种崭新的公司治理和经营业绩的评价方式,经济增加值(Economic Value Added,以下简称EVA)的应用得到了国内外众多学者广泛的研究,本文分别从理论论证和实际应用两大方面阐述
采用自编的“医学生探究学习情况调查问卷”,对苏州大学即将毕业的487名医学生进行了问卷调查。结果显示,医学生虽具有一定的探究学习意识(总均分为3.2),但探究学习的认知(总正确率6
我院自1992年2月至2003年3月,采用显微外科技术对输卵管性不孕症保守治疗无效患者,选择性进行输卵管整形术,共42例,效果良好。现进行回顾性分析报道如下。
时事政治教育是初中思想品德学科教学的重要组成部分,事关学生的健康成长和学校德育工作的发展水平。据调查,在目前的教育实践中,中学思想品德教学存在很多不尽如人意的地方,
《软件工程》是一门理论性和实践性很强的课程,教学改革的总体思路是“理论+实践”,将《软件工程》理论教学和实践教学有机结合起来,有助于提高《软件工程》的教学质量。文章探讨
针对传统的嵌入式代码编写工作量繁重、开发周期长的问题,提出运用自动代码生成技术来完成系统仿真和控制代码生成的新方法,并成功应用于三相PWM整流器控制器的设计中.