基于核函数的错误分类样例研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:yoyoyu2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论综合了机器学习、统计学习、及神经网络等方面的技术,通过利用结构风险最小化原则,在经验风险最小化的同时,有效地提高了算法的泛化能力,并且统计学习理论为机器学习中的小样本情况提供了有力的理论基础。20世纪90年代VaPnik等学者基于统计学习理论和核技术提出了一种新的机器学习方法支持向量机(Support Vector Machine,SVM),该方法是建立在结构风险最小化原则基础之上的,其核心思想是通过引入核函数技巧,把低维空间线性不可分问题,映射成高维空间线性可分问题,它能较好的解决非线性、高维识别、小样本和局部极小点等问题。SVM的发展,不但丰富和发展了统计学理论,而且在很多应用领域得到应用和推广,如:文本分类、手写体识别、人脸识别、WEB挖掘、回归分析等。如何进一步改进支持向量机的性能,一直以来都是模式识别和机器学习领域关注和研究的热点。核函数的支持向量机在分类和回归等方面虽然都已经取得了很好的效果,但由于人们在利用核函数的支持向量机对数据分析时,往往只是注意和利用正确的分类数据信息,却忽略了错误分类数据中的有用信息,并且核函数的支持向量机的分类效果对核函数和核参数的选择具有很大的依赖性。因此如何利用核函数来有效地发掘错误分类数据中的有用信息来提高分类器的分类和预测能力具有很好的现实意义。本文在核函数的支持向量机基础上,通过利用错误分类样例中的有效信息,完成了以下方面的工作:1.对支持向量机理论和算法进行了介绍和研究,简要介绍了核函数的发展历史、理论基础和基本思想;介绍了机器学习和统计学习理论基本知识。2.在核函数支持向量机基础上,提出了一种基于感知器的SVM分类模型(Support Vector Machine Classification based on Perceptron,PSVM),该模型在对分类器的训练中,引入感知器分类思想,其先利用SVM的核函数进行核计算,判断其分类性能,分类正确则不做任何修改,反之则转化成感知器分类问题。实验结果表明该模型不但能提高SVM的分类性能,而且还可以降低SVM分类性能对核函数及参数选择的依赖性。3.在核函数支持向量机基础上,通过利用差分进化算法中的数据处理操作,提出了一种基于差分进化算法的SVM分类模型(Support Vector Machine Classification based on Differential Evolution,DSVM)。该模型通过利用支持向量机的支持向量,结合差分进化算法中的数据变异、交叉操作,对错误分类的数据进行相应的处理,以期通过利用错分类数据中的有用信息,来提高分类的效果。实验验证表明该模型增加了种群个体的多样性,加快了目标函数的收敛速度。
其他文献
在众多美丽的自然现象中,流体以其极为复杂的表面特征,丰富的视觉效果成为摄影师,电影特效制作者和游戏工作者的研究对象。在离线渲染领域,出现了大量大规模运用到流体模拟的
网络汇集了海量信息资源,这些资源已经成为人类社会资源的重要组成部分。与此同时,随着计算机网络应用的深入,安全问题越来越突出,最为明显的是出现了虚拟社会中由于信任危机
因果关系一直是研究的重点,新闻报道因果关系的识别可以帮助我们了解事件之间的来龙去脉,获取事件的演化关系,有助于预测和决策,具有重要的实际应用背景。本文提出了一种基于
伴随着互联网技术的迅猛发展,分布在不同地理位置的计算机单独实现复杂的科学计算变得十分困难,为了满足用户对计算资源和计算能力不断增长的需求,网格计算模式应运而生。网
网格技术在物理、生物医学、天体飞行、科研和工业中的应用都显示了网格的优势,网格技术在电力行业的应用也将成为一种必然的趋势。   本课题分析了网格资源监控的关键技
学位
考试作为当今高校评价学生的一种手段,在高等教育中的地位越来越重要。要借助考试客观、准确地评价学生的成绩,绝不仅仅依赖于卷面分数,更重要的是利用教育测量的理论对试卷
椭圆曲线密码体制是现代密码学的重要分支,具有密钥短、安全性高等优势,适用于资源有限的便携式设备,移动平台和网络节点上的加密和数字签名等信息安全应用。本文研究椭圆曲
Web服务技术能很方便地实现低耦合的分布式系统集成,它已成为企业间或企业内部系统间功能发布和共享的重要方式。然而Web服务技术是一种无状态的功能响应,它存在功能单一,无
目标追踪的是许多像视频监视(surveillance),基于视觉的控制,人机交互接口(human-computer interface),虚拟现实(augmented real-ity)等应用的中心问题。主要的方法分为确定
从互联网开始普及以来,如何充分利用大量、不同结构、动态的互联网资源就成为信息时代的核心课题之一。信息检索是给网络用户提供网络知识服务的关键技术。但是目前也面临不