基于多维关联规则的粒度支持向量机学习方法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:yht_816
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是一种通用高效的机器学习方法,能较好地处理小样本、非线性、高维数据等实际问题,目前已经成为机器学习的研究热点,并广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题,然而SVM在解决实际问题时仍然存在一定局限性,如SVM的训练速度极大地受到训练集规模的影响、在特定的空间中泛化能力受到限制、应用领域有待于进一步拓展等。针对以上问题,本文将粒度计算(Granular Computing)思想引入SVM中,用以改进传统SVM分类器的上述缺陷。本文在粒度计算和支持向量机学习框架下,以多维关联规则挖掘为手段,提出一种粒度支持向量机(Granular SVM, GSVM)学习方法,称为AR-GSVM,并且在AR-GSVM的基础上提出一种核空间上的粒度支持向量机学习方法,称为AR-KGSVM。本文的研究内容主要有以下几个方面:(1)对现有的粒度支持向量机学习模型进行了深入系统的分析。(2)提出一种原始数据空间上基于多维关联规则的粒度支持向量机学习方法AR-GSVM,该方法不仅可以有效地降低分类器的复杂性,而且本质上的可并行计算可以提高其学习效率,同时算法重点考察靠近分类边界的数据(有可能是支持向量数据),从而保证分类器具有良好的泛化能力。(3)在AR-GSVM的基础上,考虑到算法在原始空间做粒划分而在核空间进行训练造成数据分布的不一致,而使泛化能力下降的情况,本文提出核空间上的粒度支持向量机学习方法AR-KGSVM,尝试先将样本映射到高维特征空间再进行粒划分,保证了粒划分和数据训练在同一空间,从而使学习器具有更强的泛化能力。(4)在标准UCI数据集上对本文提出的学习方法进行了验证,获得了良好的预期效果。本文提出方法的重要应用是对非平衡数据的处理,通过在标准数据集上与常用非平衡数据处理方法的比较,说明了本文提出的AR-GSVM和AR-KGSVM算法非常有效。本文提出的基于多维关联规则的粒度支持向量机学习方法,将强大的机器学习方法SVM与粒度计算思想相融合,研究成果不仅可以丰富SVM的理论和方法研究,同时SVM在非平衡数据处理的成功应用也有望进一步拓展SVM的应用领域。
其他文献
近年来,XML数据流的查询处理引起了国内外学者的广泛兴趣。如何在XML数据流中有效地查询大量XPath表达式是当今研究的一个热点问题。目前,已经提出很多种在XML文档上进行XPat
随着经济全球化和电子商务的迅猛发展,企业业务集成将面对分布、异构和动态的应用环境,传统的工作流技术也将面临巨大挑战。与此同时,面向服务的计算模式逐渐流行,Web服务技
近年来,随着物联网的发展,作为其中最为重要的射频识别(RFID)技术引起人们的广泛关注。在RFID系统基础上,结合网络技术来构建一个由大量读写器和标签所组成的物联网成为RFID