基于样本分布与熵的数值型属性离散化

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:kuakua01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发。提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。
其他文献
大型摩天轮的设计计算过程在传统计算中是比较复杂的运算过程,尤其是在风栽荷等附加载荷的计算中,由于计算量大,计算公式的难度大,所以常规的计算结果很难与实际的情况相符合。同
进入新时期,我国高校创业教育蓬勃发展,取得了巨大的成绩,在提高我国高等教育质量、促进学生全面发展以及服务国家社会经济发展方面发挥了重要的作用。但要进一步发展仍然还
为满足新形势下高等农业院校农、理、工等各专业大学生差异性发展的需求,南京农业大学构建了循序渐进的“基础型课程—提高型课程—研究型课程”实验化学课程体系,结合相关课
总书记的回信,在南京农业大学全体师生中引发了强烈反响。我们深切体会到了总书记的勉励与期望,深刻认识到了身上的责任与担当,深深感受到了作为农大师生的骄傲与自豪。借此
椭圆检测在图像理解中有重要的作用。为克服标准Hough变换对时空需求高的缺点,设计了一种改进算法。通过椭圆对称特性估计图像中可能存在的椭圆中心,利用长轴确定椭圆中心及夹角参数只需一维累积数组对椭圆短轴的投票,采用聚类分析技术将检测到的虚椭圆归类到对应的真实椭圆。对合成图像和实际图像的实验表明算法的正确和高效。