论文部分内容阅读
ID3算法是决策树算法中的经典算法,但存在多值偏向问题。一些改进的ID3算法虽避免了多值偏向问题,但多存在主观性强、没有考虑属性信息熵等问题。为了解决该问题,提出了一种基于修正系数的决策树分类算法MC。该算法利用修正系数降低取值个数多的属性的信息增益,并通过实验与ID3算法进行了比较,结果表明,当样本集中各属性取值个教不同时,算法MC在生成决策树的结点总数和分类准确率上明显优于ID3算法。