【摘 要】
:
一般学习算法使用全体训练样例去构造分类器,全体训练样例中往往包含噪音数据,冗余数据。但是有的算法对噪音数据特别敏感,有的算法对于大数据集效率特别低。样例挑选算法是
论文部分内容阅读
一般学习算法使用全体训练样例去构造分类器,全体训练样例中往往包含噪音数据,冗余数据。但是有的算法对噪音数据特别敏感,有的算法对于大数据集效率特别低。样例挑选算法是依照某种原则从原始数据集中挑出有用的、具有代表性的样例子集,用这个子集中的样例训练出来的分类器的性能并不低于用全体样例训练得到的分类器。机器学习中的数据集的冗余数据和噪声数据会影响分类器的泛化能力和训练速度,而样例挑选算法具有压缩冗余和排除噪声的能力,对于提高分类器的泛化能力和提高训练速度有一定的意义。以往的增量决策树归纳中的样例顺序都是给定的,本文研究了一种在增量模糊决策树中的样例挑选方法,使得增量归纳过程的样例不再是数据集给定的顺序,用于生成最终决策树的样例也不再是数据集中的全体样例。该方法每次都选取当前决策树最不能确定其分类的样例增量加入决策树。本文给出了该方法的详细描述,并对该方法进行了较深入的理论分析。
其他文献
能提升企业自动化程度的工作流管理系统,目前已经广泛应用于动态电子商务、制造业、银行、电信等领域。论文简介了课题研究的背景、意义,深入研究了工作流管理和Web服务技术的
Peer-to-Peer网络技术是目前国际计算机网络技术研究领域的一个热点,其主要目的就是充分利用互联网中所蕴含的潜在资源。而P2P搜索技术研究也一直是P2P网络技术研究的一个重
当前网络交换设备的发展方向是研究如何在高负载情况下实现高速交换。对现有的交换设备进行硬件升级是很好的选择,但是也带来了成本的增长。为了在现有的工艺水平上提高设备的
随着计算机技术的不断进步,计算机视觉的研究对象已经从单幅静止图象的研究转到对运动图像序列的研究。运动分割是把序列图像划分为在语义上具有不同意义区域,进而分割出运动
随着网络的广泛应用,网络安全问题越来越重要。网络攻击方法层出不穷,入侵手段也不断更新,使得目前的防火墙等被动的网络安全机制对许多攻击难以检测。入侵检测作为一种主动
Web服务是以XML为基石的、开放的Web规范技术,同时作为面向服务架构的最主要实现形式,Web服务在信息共享、资源共享很多方面得到了广泛的应用。"国家击剑队信息化平台"是由国
随着集成电路设计方法和工艺技术的提高,数字系统的性能越来越强,集成度也在迅速提高。特别是在系统芯片SoC(System-on-a-Chip)出现以后,业界对缩短芯片的设计开发周期、缩小产
随着3G时代的到来,无线网络的带宽将呈现大幅度的增长。这给移动应用带来无限的契机。对于移动可视电话这样的多媒体应用来说,由于视频数据量往往比较大,2.5G带宽还难以承受较高
最优路径算法一直是学者们关注和研究的热点,传统的最优路径算法主要是在静态网络下求解单一约束条件——结点之间路径长度下的最短路径,在算法求解之前该值是确定的,并且是可知
无线传感器网络作为一种新型的测控网络,在军事、工业、环境监测和医疗等诸多领域都有着巨大的应用价值。随着它的快速发展,逐渐成为了煤矿安全生产和煤矿信息化的一个重要手段