论文部分内容阅读
传统的GentleAdaboost方法在处理不平衡数据集的分类问题时,通常采用过抽样方法,以达到数据集的平衡。但这样处理通常会引人难以分类的奇异样本,导致分类器的分类性能下降。为此,针对不平衡数据集分类提出了一种改进的GentleAdaBoost算法。考虑到传统GentleAdaBoost算法中容易分类的样本具有较小权重的特点,在分类器的迭代学习过程中,设定一个样本的权重阈值,仅对少数类样本中低权重样本进行复制,然后采用上述数据集进行分类器的训练,得到相应的弱分类器;重复上述步骤进行迭代,在完成平衡数据集