具有容噪特性的C4.5算法改进

来源 :计算机科学 | 被引量 : 0次 | 上传用户:mujun246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与控制平滑度相结合的最优化问题,从而获得主成分空间;另一方面在决策树自顶向下构建新节点的过程中,再将主成分空间恢复到原始数据空间来避免降维过程中属性特征信息永久消失。实验结果表明NFPCA-in-C4.5算法兼具降维和容噪功能
其他文献
本文指出了企业档案编研工作存在着意识淡薄、力量薄弱、质量堪忧等问题。针对存在的问题,提出了企业要转变观念,强化编研意识;强化编研力量,提高人员素质;加强企业档案编研
LED灯具有光效高、寿命长,没有紫外线和红外线辐射等优点,因此正在成为照明市场的主力光源。LED灯用于档案室照明的主要障碍是其显色性差,近年来通过将多种颜色的LED灯混光的
提出了一种基于生存检测参数的可生存系统自主管理模型.自主管理机制通过自主检测和控制单元来实现.首先,定义了若干生存检测参数,依据累计分布函数确定了动态可变的阈值约束
为了全面了解我国科技档案管理标准化发展情况,分析我国现行科技档案标准体系存在的问题,本文借助“国家标准文献共享服务平台”,对我国现行科技档案相关标准进行了评细的调
存量数字化工作成为国家层面上档案工作的信息化战略,是我们面对大数据时代的挑战与机遇,是全面推进档案数字化建设的必由之路.无论采取何种形式,做好相应的安全管理工作是存
随着档案信息数字化的快速发展,信息安全问题凸现出来。如何确保数字档案信息安全,成为档案界广泛关注的话题。本文通过论述威胁数字化档案信息安全的各种因素,提出针对出现
溢洪道堰面受水流长期冲刷出现裂缝,为此需用爆破方法剥离40cm厚的一层钢筋混凝土.通过试验,取得了合理的爆破参数.对于飞石,采取了覆盖、挡墙、包裹等有效的防护措施;对于爆
全球化经济浪潮不可阻挡,企业在发展经济的同时,更是绞尽脑汁地求生存、促发展。不同的企业在各自的发展过程中都形成了独有的企业文化。档案作为企业的宝贵财富,在企业文化建设
本文采用文献综述法,概述了美国、澳大利亚政府数字转型策略及我国数字转型过程中政策及实践情况。从企业基层档案工作者的视角,领悟政策、结合实践,剖析数字转型背景下企业