论文部分内容阅读
支持向量机是基于统计学习理论的VC维和结构风险最小化原则建立的一种通用机器学习算法。它较好地解决了传统学习方法难以处理的小样本、高维、非线性等问题,且具有较好的泛化能力。自提出以来,支持向量机得到了越来越多的专家和工程技术人员的青睐,并已成功应用到人脸识别、遥感图像分析、文本分类等众多模式识别领域。尽管支持向量机在众多实际问题中得到了广泛应用,但它仍存在着一定局限性。如,支持向量机对噪声较为敏感,且对不均衡样本分类准确率不高。再如,支持向量机所处理的样本为实随机变量。在一些实际问题中,样本往往为非实随机变量(随机集和模糊等)。针对支持向量机存在的上述问题,本文分别研究了基于噪声不确定性样本、随机集不确定性输入样本和模糊等不确定性输出样本等三类不确定支持向量机。本文的主要创新点及工作如下:(1)提出了基于直觉模糊数的支持向量机和多类支持向量机。直觉模糊数作为模糊隶属度的一种推广,它比传统的模糊隶属度更加细腻地描述客观世界中的模糊性。基于直觉模糊数的支持向量机通过核函数在特征空间中给每个训练样本赋予一个直觉模糊数,利用直觉模糊数的得分函数描述每个训练样本的分类贡献,消除噪声对支持向量机的影响。基于上述支持向量机分别构建了一对一和一对多模式下的多类支持向量机。针对一对多模式中不均衡样本的特点,对不同类别样本赋予不同的权重。数值实验验证了该类不确定支持向量机的有效性。(2)构建了基于随机集输入样本的支持向量机和多类支持向量机。随机集是随机变量的一种重要拓广,它能有效地处理复杂不确定环境下的模糊性和经验性数据。基于随机集输入样本的支持向量机以随机集的可测选择作为主要特征,将随机集输入样本的分类问题转化为了可测选择的分类问题。基于随机集输入样本的多类支持向量机利用模糊C-均值聚类算法将随机集输入样本转化成为实样本,进而将随机集输入样本的多类分类问题转化成实样本的多类分类问题。数值实验验证了该类不确定支持向量机的有效性。(3)构建了可信性空间上基于模糊输出样本的支持向量机和不确定空间上基于不确定性输出样本的支持向量机。基于可信性测度和置信水平,可信性空间上基于模糊输出样本的支持向量机给出了样本类别的动态划分方法,构建了一个动态的分类超平面,有效处理了模糊输出样本类别的模糊性。同样,基于不确定测度和置信水平,不确定空间上基于不确定性输出样本的支持向量机也给出了样本类别的动态划分方法,有效处理不确定性输出样本类别的不确定性。仿真实验验证了该类不确定支持向量机的有效性。(4)两类不确定支持向量机应用于人脸识别。由于光照、姿态和表情等因素的影响,人脸图像中存在着噪声、模糊、随机集等不确定信息。为了有效处理人脸图像中的这些不确定信息,本文分别将基于直觉模糊数的支持向量机和基于随机集输入样本的支持向量机应用于人脸识别中,利用人脸数据库验证了这两类算法的有效性。