选择性支持向量机集成算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:jy8578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是一种建立在统计学习理论基础上,以结构风险最小化为原则的机器学习方法,由于具有良好的泛化能力,能很好地解决高维、小样本、非线性等问题,具有广泛的应用。支持向量机的实现过程实际上是求解一个凸优化问题,数据的高维性导致时间效率的降低,另外凭经验选择核函数及相关参数,不能保证参数的最优性,这些缺点降低了支持向量机的稳定性和泛化能力。  集成学习是提高分类器泛化能力的有效途径,通过训练并组合多个准确而有差异的基分类器,最终实现比单个分类器性能更佳的集成分类。大量理论分析与实验表明,选择性集成根据某种策略从基分类器中挑选部分性能较佳的进行集成,能进一步提高集成分类精度以及机器的泛化性能。群体智能优化算法是选择基分类器的有效方法之一,差分进化算法是一种比遗传算法、粒子群算法原理简单、控制参数少,且搜索速度更快的智能算法。鉴于支持向量机的优势及不足,本文提出了基于差分进化算法的支持向量机集成方法:针对高维数据特点,首先采用Relief算法进行属性约简,然后基于Adaboost方法训练多个基分类器,最后采用差分进化算法进行基分类器的选择,并最终实现基分类器的加权集成。  在声纳信号(Connectionist Bench),弥漫性大B细胞淋巴瘤生物医学(DLBCL),混合系白血病基因诊断(MLL Leukemia)3个高维、小样本的数据集上进行了仿真实验,试验结果表明本文算法的分类精度要比 Adaboost以及单一 SVM都好,说明该集成方法能进一步提高分类精度,是一种有效的、可行的集成分类方法,且具有较高的泛化性能和鲁棒性。
其他文献
摘 要:以尿素为原料生产三聚氰胺的工艺技术路线有多种,代表性的有欧技高压法、常压气相淬冷法、加压气相淬冷法以及新型中压法。选择适合的生产工艺路线,是化工企业延伸产业链,发展高端精细化工的趋势。  关键词:三聚氰胺;工艺路线;分析;比较  三聚氰胺俗称蜜胺,是尿素在高温下缩合反应生成的一种用途广泛的有机化工中间体。近年来,随着原材料、能源价格的不断上涨,尿素的生产成本不断增加,加上产能过剩,竞争激烈
本文主要研究地球物理流体动力学中的大气简化方程组的一些性质,我们从数学上严格证明了线性稳态方程弱解和强解的存在性.  在第一章中,我们介绍了大气简化方程组的研究背景
基本超几何级数,简称为q-级数,在过去二十多年发展极为迅速,并在组合学、数论、物理学和计算机代数学中有着广泛应用。多项式插值理论是逼近论和数值计算中重要的研究内容。利用
金融市场中的标的资产的波动率一直以来都是学界和实务界关注的焦点。鉴于波动率在现代金融市场中的重要性,以及它是度量风险的重要参数,波动率的研究一直是金融市场研究中的重
在马路上随便找个小朋友,问他胡萝卜是什么颜色的,相信他一定会毫不犹豫地回答:橙色。的确,在我们的日常生活中,所见到的胡萝卜基本全是鲜亮的橙黄色,配上绿色的叶子,别提多喜人了。但是如果有人说,胡萝卜是紫色的,你会有什么反应呢?  “你在逗我吗?”相信这是很多人的第一反应。但是,你有这样的反应不是因为“胡萝卜是紫色的”这个命题异想天开,而是你听到它的时间不对。事实上,在17世纪之前,世界上绝大部分的胡