基于区间类信息熵的连续属性离散化方法

来源 :全国第17届计算机科学与技术应用(CACIS)学术会议 | 被引量 : 0次 | 上传用户:between930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续属性离散化问题是数据挖掘重要的研究步骤之一.本文基于粗糙集的有关理论,提出了一种新的连续属性离散化方法.首先提出度量属性区间离散化效果的区间类信息熵的概念,然后根据已有数据的取值构成候选断点区间集,在控制区间类信息熵小于给定的某个值ζ的前提下对相邻的区间进行合并.最后通过实际的数据分析,说明该算法与经典的离散化算法相比,离散化效果更好,更有利于下一步的分析工作。
其他文献