论文部分内容阅读
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分类器的分类效果受到影响。本文提出了一种根据训练样本偏离“真实类中心”的程度——离心度,给训练样本赋予权值的算法WS-ARC-BC(Weighted SampleARC-BC),提高分类器的稳定性,从而提高分类器的分类效果。实验表明,该算法能够有效提高分类效果。