论文部分内容阅读
针对k—means算法在聚类前必须给出聚类个数的不足,本文利用类内相异度和类间相异度对该算法进行改进,试图在初始输入条件只有初始数据集的基础上,得出较好的聚类结果。首先给出了类内相异度和类间相异度的定义,描述了改进k—mean。算法的定义和执行过程,最后使用KDDCUP99数据集对此改进算法进行了仿真实验,实验结果表明此改进的k—means算法相对于k-means算法在误报率方面有较好的检测效果。