【摘 要】
:
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛
论文部分内容阅读
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5,KNN,SM0,SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN,SMO和SVM方法相当.
其他文献
建筑施工在现代社会中显得特别重要。在施工建设中有很多情况下需要在规定的时间内完成相应的任务,应该有效的保障工程的建设质量,这样不仅有利于施工程中的时间问题,还有利
近年来宗教活动逐渐向高校校园渗透,部分境外宗教势力已严重侵蚀了高校大学生的思想和行为。高校应予以高度重视,把抵御和防范某些有不良企图的组织利用宗教向校园渗透作为高
目的:筛选参芪肺宝的最佳水提工艺,初步探索颗粒剂成型工艺。方法:釆用L9(34)正交试验设计法,以黄芪甲苷的含量和浸膏得率为评价指标,提取时间、加水量、煎煮次数为影响因素,
以 34个引种欧洲黑杨无性系及 107杨、陕林 3号 2个对照无性系为试验材料,在水分胁迫条件下对无性系的生理和生长差异进行分析。建立了抗旱性筛选的指标体系,对无性系抗旱能
介绍了La2Zr2O7的结构及作为热障涂层材料的热力学性能;综述了国内外制备La2Zr2O7粉末的方法及其工艺对产物性能的影响;论述了La2Zr2O7用作热障涂层的优缺点和有待解决的问题
产出不确定是当前众多企业面临的现实问题,给供应链管理带来了严峻的挑战.结合实际案例,分析了产出不确定对供应链运营带来的影响.在此基础上,对产出不确定环境下供应链竞争
本文针对目前教学的现状,依据新课标理念,通过对思维导图概念的界定、制作步骤以及应用策略详细地阐述,积极探索课堂的有效教学。
球磨技术在淀粉改性中的研究和应用日益广泛。综述了球磨处理对淀粉特性的影响以及影响球磨效果的因素,对其未来的研究方向和应用前景也作了一定的展望,以供参考。
<正>人类认识自然生态存在着一个认识论上的发展和变化,历史地看大致有以下四种不同的自然观.早期生态观认为自然生态是一个运动不息并充满活力的,同时也是一个有秩序、有规