半监督孪生支持向量机

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:hunterfall_horse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孪生支持向量机(Twin Support Vector Machines,TWSVM)是在2007年提出的,在形式上类似于经典的支持向量机(Support Vector Machines,SVM),时间消耗上却缩减到了SVM的1/4。它的思想来源于近似支持向量机(Proximal Support Vector Machines,PSVM)和基于广义特征值近似支持向量机(Proximal SVM based on Generalized Eigenvalues,GEPSVM)。与SVM一样,TWSVM也具有坚实的理论基础,并且具有推广能力强等优点。自从TWSVM提出以来,就因为其优越的性能而成为了机器学习领域的一个研究热点。学者们也对其提出了各种优化和改进。而TWSVM的标准形式也只适用于有监督学习的情况,而现实生活中产生的大量数据都是无标签的,在有监督学习中仅采用有限的有类别标签数据时,很难得到具有强泛化性能的学习器,因此TWSVM并不能很好地利用这些无标签数据来提高自身的学习能力。面对少量的有标签数据和大量的无标签数据,半监督学习方法可以帮助TWSVM提高解决这类问题的分类性能。将半监督学习思想引入TWSVM中,使两者相结合,可以改善标准TWSVM的缺点,并获得更好的分类效果,而这个问题的研究也有其重要的意义,本文的主要研究内容如下:首先,本文在标准TWSVM的基本形式上,即其优化函数中,加入了无标签数据,从而提出了半监督孪生支持向量机的最原始模型。原本的标准TWSVM中,都是针对有标签数据而言,整个表达式中也必须是利用有标签数据。而在经过对标准TWSVM的表达式进行一些推导改造之后,能够将无标签数据也在表达式中体现出来,这意味着我们可以在求解的过程中就利用到无标签数据,而这也可以认为是半监督孪生支持向量机的原始模型。其次,本文在考虑到半监督孪生支持向量机的原始模型求解复杂后,利用流形正则化框架而提出了基于全局保持的拉普拉斯半监督孪生支持向量机(Laplacian Global Preserving Twin Support Vector Machine,LapGTSVM)。流形正则化框架一直以来作为研究热点能够被有效地利用到半监督学习中,拉普拉斯孪生支持向量机(Laplacian Twin Support Vector Machines,LapTSVM)便是学者利用流形正则化框架最早提出的一种能将孪生支持向量机运用到半监督学习中的机器学习方法。而本文建立的LapGTSVM则是在Lap TSVM中嵌入数据样本的全局结构信息,使得所构造出来的分类器能够充分考虑数据样本的全局与局部信息,在性能和稳定性方面都有很大的提升。最后,采用半监督核中Bagged聚类核这一方法,将孪生支持向量机以另外一种方式来充分利用无标签数据,而提出了基于Bagged聚类核的半监督孪生支持向量机(TWSVM Based on Bagged cluster kernel for semi-supervised,Bagged-TWSVM)。该方法中,其主要思想就是利用半监督核中的聚类核,该核能够对样本之间的相似度信息进行过重新调整,使得位于同一聚类样本之间的相似度增大,而被聚到不同类中的样本,他们之间的相似度缩小。Bagged-TWSVM能够充分利用无标签数据的信息,进而提高分类精度。
其他文献
当前对综合柔性调度的研究,仅考虑工件间存在顺序约束关系的情况,忽略了工件间存在延迟约束的情况,事实上,实际生产调度中存在延迟约束的问题,如果不考虑工序间的延迟约束,将使得生产调度计划不精确或不可行,因此,有必要对综合柔性调度中存在延迟约束的问题的进行研究。对于综合柔性调度中存在设备无关延迟约束导致调度结果不精确的问题,提出存在设备无关延迟约束的综合柔性调度算法。该算法通过提出存在设备无关延迟约束的
伴随着计算机网络的广泛应用以及信息技术的逐步提高,保障网络信息系统的安全变得尤为重要。虽然人们曾尝试着使用入侵检测系统和防火墙等技术来发现和抵御攻击者的入侵行为,
随着如今计算机和网络技术的发展,网络视频会议系统的应用已经越来越广泛,已经成为企业内部沟通和交流的重要手段。但传统的网络视频会议系统,软硬件成本高,开发工作量大,越
水面无人艇可以执行多种不同的任务,具有速度快、智能高等优点。虽然水面无人艇具有如此多的优点,但是受到现在的技术水平的限制,让水面无人艇完全脱离人的监督和操作而具有
无线传感器网络(Wireless Sensor Networks,WSN)节点定位是一种根据已知节点位置计算未知节点位置的技术。现有的节点定位算法大多是基于二维平面研究的,由于三维空间中求解
人脸识别技术是一项具有广阔发展前景和实用价值的研究课题。人脸识别技术一般包括人脸图像预处理、特征提取和图像识别三个部分。本文主要研究了人脸图像的预处理,基于正交
移动对象以一定的数据模型存储于移动对象数据库中;为了满足多种应用需求,移动对象数据库中通常集成多种数据模型,但这种方法带来了异构数据的访问问题。XML的特点很好地适应
魔力平台作为一个商业系统的建模系统,采用零编码、参数化、图形式的模型定制方式,摆脱了繁重的代码编写工作,能够有效地保证软件的质量,降低软件开发的成本,提高软件的开发
当今多种无线通信技术争相发展,其中一种比较新的无线网络技术——无线Mesh网络正在逐渐走入人们的视线。无线Mesh网络具有动态自组织、自配置、自愈性等诸多特点,能够加快部
为提高地铁在站运行效率,本文探讨了一种用反向学习人工免疫算法优化地铁站内运行的方法。   本文优化的对象是站内运行的相邻列车,即前行列车和后行列车。站内运行过程包括