【摘 要】
:
支持向量机(SVM)是解决分类问题的一项机器学习核心技术。然而,实际工程中由于数据采集不及时,数据样本不全面,数据不连续导致训练样本很难覆盖全部样本空间,对外往往表现出
论文部分内容阅读
支持向量机(SVM)是解决分类问题的一项机器学习核心技术。然而,实际工程中由于数据采集不及时,数据样本不全面,数据不连续导致训练样本很难覆盖全部样本空间,对外往往表现出较低的价值密度,造成分类器的泛化性与鲁棒性下降。目前基于知识的支持向量机可有效解决这一问题,但由于完备的、有效的先验知识难以获取,而且知识本身往往也不足以描述数据的全部特征,使得最终分类性能提高并不明显,甚至还可能导致负效应。因此,本文提出从训练数据中挖掘先验知识的方法,来有效提高分类器性能。由于任何一个样本子空间都可以通过有限开球集合线性组合得到其开球覆盖。故基于训练样本的这种开球覆盖即可描述其分布特征,从而提取出可用于分类的重要信息。正是基于这一认识,本文提出了三种提取训练样本分布特征的方法,以这些特征为基础构建有利于提高分类器性能的先验知识,并给出基于先验知识的临近支持向量机算法:基于普通超球体的临近支持向量机(O-PSSVM)、基于SVDD超球体的临近支持向量机(SVDD-PSSVM)、基于马氏距离超球体的临近支持向量机(M-PSSVM)。实验证明引入普通超球体、SVDD超球体、马氏距离超球体都能提高临近支持向量机(PSVM)的泛化性和鲁棒性。同时发现SVDD-PSSVM、PSVM的分类能力明显强于SVDD分类器,M-PSSVM、PSVM的分类能力明显强于马氏距离超球体分类器,说明SVDD和马氏距离超球体本身不适于直接构建分类器。最后,本文将SVDD-PSSVM应用于列车空调的单标签和多标签的故障诊断当中,取得了很好的诊断效果。
其他文献
随着计算机与网络技术的飞速发展,网络端之间数据传输的可靠性、安全性和公平性等问题直接影响着数据传输的效率,而计算机网络协议则是负责数据传输的关键,可见,优化计算机网
目前,我国的物流企业正处于一个高速发展的时期,发展物流产业的目标是提高物流效率,降低物流成本,从而最大程度满足客户需求。这使得物流行业朝着信息化、网络化、智能化、标准化
列车的方便、快捷无疑为我们的生活带来许多便利,但同样列车的安全、运输效率也越来越受到人们的重视,列车性能的改进成为该领域的核心内容。我国在考虑自身的实际情况和未来发
随着嵌入式技术,数字图像处理技术,网络通信技术和视频压缩技术的快速发展,嵌入式视频监控系统正朝着网络监控和智能监控的方向发展。在智能视频监控方面,无论是国内还是国外
合成孔径雷达(SyntheticAperture Radar, SAR)凭借其独特的优势在军事、国民经济领域中有着广泛的应用。然而事实上SAR系统的信息获取技术明显超前于信息处理技术,使得SAR图像数
随着计算机技术及互联网技术的快速发展,越来越多的隐私信息在网络中传输,由此产生一系列信息安全问题,如:非法窃取、监听、传播数据信息等。图像是信息传递的一种重要方式,
自二十世纪九十年代以来,多Agent系统逐渐成为人们研究的热点,对许多科学技术的发展产生了深远的影响。多Agent系统比较适用于复杂的分布式计算,且能有效地避免大规模分布式站点
公共交通网络是现代城市交通网络中最重要的基础设施之一。在大中城市,公共交通系统扮演着尤为重要的角色,特别是在“低碳生活,绿色出行”概念越来越受市民认可的今天,公共交通更
功耗已经成为设计各种计算机设备必须考虑的首要问题。移动嵌入式设备,如智能手机、平板电脑等,不仅电池电量有限,而且电池密度发展缓慢。更低的功耗意味着更长的使用时间和更好