非理想状态下支持向量机学习算法的研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:w359624042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为上世纪九十年代兴起的一种新的机器学习技术,支持向量机(Support Vector Machine,SVM)在许多领域都取得了成功的应用。但它的应用其实大多局限于常见的标准化或者说“理想化”的数据分布情况,对于在实际应用中不得不面对的一些数据分布不合常规或者说不“理想”的机器学习问题,比如:不确定性输入信息学习、不平衡数据集分类、半监督型数据学习等,传统型支持向量机的学习性能则表现得不尽人意,有时甚至根本达不到人们所期望的学习效果,这在很大程度上影响了支持向量机向更大范围的推广和应用。针对这些问题,本文就几种非理想状态下的支持向量机学习算法进行了研究和探讨,给出了较理想的解决方案。 在简单回顾标准支持向量机及其数学基础之后,本文重点研究了三类非理想状态问题的支持向量机学习算法。 针对某些训练样本存在输入信息不确定的问题,通过引入灰色理论中区间数及区间运算的概念,结合支持向量机的特性,提出了解决不确定信息的灰信息支持向量机分类及回归算法。该类算法用区间数来表示不确定的输入信息,利用区间运算来替代原来学习函数中的运算,并根据区间运算结果来对信息不确定的输入模式进行学习。同时借鉴灰色理论中区间距离的思想,文中还提出了解决单值分类问题的的灰信息支持向量域分类算法(gray supportvector domain description,GSVDD)。 针对不同类别样本在数量分布上存在差异的不平衡数据问题,本文研究了不平衡状态下实际分类面和数据不平衡度的关系,通过采用一种新的上抽样技术(over-sampling)---SMOTE来纠正实际分类面形状偏离理想分类面的现象;同时还对传统支持向量机的惩罚函数进行了调整,引入了差异性惩罚的思想来纠正传统算法中的分类面偏移现象。 在SVM的实际应用中由于样本采集的困难以及采样成本的代价过高,在给定的数据集中往往存在部分没有被标识的样本,这类问题称之为半监督型学习(semi-supervised learning)问题。本文针对Joachims.T提出的解决半监督型学习问题的直推式支持向量机学习算法(Transductive Support VectorMachine,TSVM)存在的诸如训练速度慢、泛化能力弱等一些缺点,提出一种改进的直推式支持向量机分类学习算法。该算法通过采用个体样本标号判断和交换准则取代TSVM算法中的成对样本标标号交换法,能正确确定无标识样本中的正标识样本数,克服了传统TSVM算法存在的缺点,增强了TSVM算法学习算法的推广能力。作者还对论文中提出的几种非理想状态支持向量机学习算法进行了实验验证,结果表明这些算法在非理想状态下学习问题中均取得了较好的学习性能。
其他文献
目前,随着无线网络的发展和个人移动终端的日新月异,人们已经能够并且习惯通过无线网络随时随地地获取信息。同时,对于移动终端之间的资源共享和数据传送也有了越来越多的需
学位
地铁作为城市公共交通体系的重要组成部分,与城市居民的日常生活息息相关。随着我国城市化水平的不断提高,地铁在缓解城市尤其是特大城市交通压力和疏散城区人口等方面所起的作
海洋平台是进行海上油气开采和运输的重要工程装备,由于所处环境复杂多变,长期服役容易产生疲劳损伤,模型实验因比尺效应等限制无法模拟真实平台结构,为保障平台的安全稳定运
目前,随着技术的发展,传统的信息和媒体服务已经渐渐无法满足人们的需要。人们获取信息的发展趋势正在由固定走向移动,由语音走向图像及多媒体,更多的人们现在希望可以随时随
图像、音频、视频等多媒体文件含有直观和丰富的数据信息,如何有效地、安全地管理这些信息一直是多媒体信息管理的目标。分形集合的整体或者局部都很难用欧氏几何规则表示出
医学影像诊断是医学无创伤性诊断的主要方法之一。医学影像已成为疾病诊断、术前决策、手术导航和术后随访等临床工作的重要依据。面向医学图像的诊断技术研究作为医学和计算
情感是人际交流中重要的组成部分,是态度的一部分,是当代认知科学领域研究的热点问题。目前为止,面对海量数据,以人工的方式进行情感分析已经不能满足需求,迫切需要计算机能
开列正确的操作票是确保正确倒闸操作的前提和关键,也是变电站及电力系统安全稳定运行的保证,本系统采用人工智能理论,在变电站操作规则及线路操作规则的基础上建立规则库,联合Prolog及VC两大开发平台建立推理机;另一方面,针对自动开票专家系统的开发过程中软件重用少、生产效率低的常见问题,我们提出采用构件技术包装系统,提高系统的通用性及可维护性;并且结合方便快捷的图形操作方式,在保证数据一致性的前提下,
信息-物理融合系统(Cyber-Physical Systems,CPS)的概念于2006年由美国国家科学基金会提出。CPS是异构子系统通过网络融合的大型、异构、分布式实时反馈系统,与传统的嵌入式