【摘 要】
:
数据库知识发现是(Knowledge Discovery in Databases,简称KDD)是当前涉及人工智能和数据库等学科的一门相当活跃的研究领域,分类是其中的一个重要研究方向。决策树是分类中
论文部分内容阅读
数据库知识发现是(Knowledge Discovery in Databases,简称KDD)是当前涉及人工智能和数据库等学科的一门相当活跃的研究领域,分类是其中的一个重要研究方向。决策树是分类中常用的模型之一,自1966年被提出以来已经得到了广泛的研究和应用。然而,由于其种类偏见和抗噪性差等问题,使决策树优化成为研究人员关注的热点。 本文基于粗糙集合理论对决策树构造算法的优化问题展开研究,主要工作如下: 1.综述并分析了现有决策树经典算法及优化算法。 2.提出了混合变量决策树结构,并基于该结构提出了基于粗集的混合变量决策树算法RSH及其改进算法RSH2。RSH算法遍历所有的属性子集,选择尽可能少的属性明确划分尽可能多的实例;RSH2通过对属性的预排序,不用遍历所有的属性子集,因而可以快速地得到最佳的属性组合。 3.针对传统决策树抗噪性较差的问题,基于可变精度粗集模型提出了VPRsDt算法,利用粗糙集合的相关理论来进行决策树分裂属性的选择和剪枝,将变精度正域作为属性选择判据,减小了噪音对属性选择的影响;将多数包含关系作为决策树停止分裂的标准,减少了特例化的规则而不会影响模型的预测能力,避免了过度拟合问题,同时减小了决策树规模。 4.基于上述研究,实现了原型系统,从理论和实验上证明了所提出的算法的正确性和有效性。
其他文献
专家系统是人工智能应用研究最活跃和最广泛的课题之一。CLIPS(CLanguage Integrated Production System)是常用的专家系统开发工具。专家系统外壳是一种专门工具,是为某些类
本论文研究人的视觉系统对粗糙表面光泽度的感知,在中尺度上建立一个粗糙表面感知光泽度的生成式模型。粗糙表面的成像是由三个因素决定的:表面拓扑结构、对光的反射特性、光照
DCS,即所谓的集散型控制系统,是相对于集中式控制系统而言的一种新型计算机控制系统,它是在集中式控制系统的基础上发展、演变而来的,目前已经被广泛应用于电力、化工、石化
自20世纪90代中期开始,非真实感绘制(NPR)逐渐成为计算机图形学的研究热点之一。非真实感绘制指的是利用计算机生成不具有照片般真实感,而具有手绘风格的图形的技术。其目标
随着情感计算和智能化的人机交互界面的发展,要求机器具备感知和理解人的情感的能力。因此,面部表情分析作为一个重要的课题被提出来,并在近十多年来展开了广泛的研究。目前
CISC处理器在实际应用中最为广泛,相关软件最为丰富;但是它也有着现代微处理器中最复杂的存储管理单元。本文来源于西北工业大学航空微电子中心所承担的国防“十·五”预研项
随着计算机技术和网络技术的发展和普及,计算机技术已从传统的单用户工作模式转变为多用户协同工作模式。计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)
把现有的Web服务按照一定的语义和逻辑自动组合起来,以得到增值的服务是当前Web服务领域研究的一个热点。目前Web服务组合面临的主要问题是系统的可伸缩性、消息传输效率以及
实时协同编辑系统作为CSCW的一个重要应用,近年来得到了广泛研究。本文介绍了一种实时协同编辑算法及其在协同编辑器Z-Office中的设计与实现。本文首先对现有多种协同编辑并
近年来,随着计算机网络的蓬勃发展,电子商务已经逐渐成为一种重要的经济模式和理念。电子支付作为发展电子商务的一个重要手段和基础得到了人们的广泛关注。电子支付的安全性