论文部分内容阅读
总体错误率(TER)在处理多类分类问题中采用传统的一对余的学习方法,导致在训练过程中因多次计算而浪费不必要的时间;同时也可能对数据一类对多类的划分产生不平衡的数据集从而对实验精度产生影响。因此本文提出了专门针对多类分类问题的新算法:多类分类总体错误率(MTER)。多类分类总体错误率以极端学习机的一致逼近性为基础,对多类分类问题的总体错误率进行了改进:用一种统一的最优化模型分别计算多类分类样本中每一类的总体错误率,既可以避免多次计算中不必要的计算步骤从而节约时间,同时把各个类别的数据集统一划分,分别计算而不是一类对多类的不平衡数据从而避免产生不平衡的数据,具有很好的优越性。实验结果证明了多类分类总体错误率(MTER)算法的优越性。孪生参数间隔支持向量机(TPMSVM)在模型运算过程中需要对二次规划模型进行计算,比较复杂耗时。针对这一缺点,本文提出了孪生参数间隔极端支持向量机(TPMESVM)。TPMESVM利用极端学习机的一致逼近性的优点,运用到分类问题的最优化算法中进行改进:(1)通过用泛化能力较好的ELM核替换原始的SVM核,使得核函数的选取能够更加明确有效;(2)约束条件中的预测值和目标值在一定允许的误差情况下等价逼近,对最优化模型采用等式约束,仅需求解方程组就可得出优化模型的解,简化了运算步骤。TPMESVM算法的实验结果表明其在保证运算精度的前提下大大地减小了运算时间。