一种基于信息熵建立决策树的算法

来源 :常州工学院学报 | 被引量 : 0次 | 上传用户:senfa88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。
其他文献
数学分析和研究中,许多最普通的不等式都起源于凸函数.本篇文章从凸函数的定义出发,得到函数的连续性,推导出Jensen不等式,并由此得到n个正数的算术平均与几何平均之间的不等
提出了一种基于AVS标准熵解码器的设计方案。采用桶形移位器进行移位,采用并行结构确定码长。采用算术方法对19张码表进行算术优化,从而减小了芯片面积,提高了解码速度。采用
设计了一种适用于H.264/AVC标准的Exp—Golomb硬件编码器,在电路中提出了首1过滤器、首1检测器复用的电路结构.并采用了改进型并串转换器等关键单元,实现了码长及码字后缀信息值的
对TD—SCDMA网络的RRC协议在Iub口的消息及业务流程进行了深入分析。提出了RRC协议在Iub接口调用ANS.1解码器的解码方法及CDR合成方案,并实现了对RRC协议的统计功能。着重分析
提出了一种基于FPGA的数字通信误码测试系统设计方法,重点讨论了实现误码测试的伪随机序列产生,自校验误码插入,位同步原理及实现方法,在EP1K30TC144—3FPGA上实现了测试系统的核
为提高语音和视频通话质量,在介绍TD—SCDMA集中监测系统整体结构和功能的基础上,分析了3G-324M协议在Iub和Iu—CS接口协议栈中的承载方式以及内部各子协议之间的协作关系,创新
从古到今,人的意识中出现了一种安于现状的思想,即顺受思想,相对地,由于顺受思想的挟制,也就诞生了一种与之相反的一种思想,即思想逆反。思想顺受与思想逆反这个矛盾体的诞生
房屋建筑学具有很强的综合性和实践性,教师在实际教学过程中可以通过创造生动有趣的课堂、应用现场教学等方法,提高学生的学习兴趣,调动学生的学习积极性,发挥学生的主观能动性,以
随着我国经济社会的发展,生产需求的提高,我国各大产业的发展都如火如荼,在这一大发展时期,我国的各项建设事业也在积极开展,使我国的发展速度不断加快,这是我国建筑业发展的一大机
在学分制条件下实施本科生导师制,是当前大学生管理体制、育人体制改革一个重要突破口,是充分发挥学生个性的一种教育管理手段。文章主要探讨如何构建导师制,阐明了导师制在学分