基于粗糙集理论的最简规则获取方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wingoH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库知识发现(KDD)与机器学习相比,它的一个很重要的特点就是数据量巨大,因此要求学习的效率必须很高;另外,由于数据库知识发现最终是面向人的,因此人们也希望获取的规则能尽量地简洁。目前已有多种模型被提出,在这些模型中,决策树尤其适用于数据挖掘,因此,我们的重点在于构造决策树,并从决策树中提取分类规则。 在决策树学习算法中,颇具影响的是ID3算法的改进算法C4.5方法,该方法先生成决策树,然后将其转换为规则。但是由于构造过程中没有考虑树的深度,节点的个数等问题,C4.5方法得到的规则集并不一定是最简的,所以有必要对C4.5方法加以改进。本文首先利用可辨识矩阵生成的属性核改进了极小化方法,然后利用改进的极小化方法对C4.5决策树规则进行处理,给出了一种决策树最简规则获取方法,使得决策树规则得到有效的简化。在本文的最后,进行了仿真实验,并对实验测试结果进行了分析。实验结果表明,采用本文方法既能简化单个规则,又能使规则的总长度减少。同时,在简化规则的基础上还可以使得算法的正确识别率有所提高。
其他文献
随着信息技术的飞速发展,信息安全己逐渐发展成为信息系统的关键问题。入侵检测作为一种主动的信息安全保障措施,有效地弥补了访问控制、防火墙和身份认证等传统安全防护技术
现有的互联网所提供的是“尽力而为”(best-effort)的服务,在这种服务模型下,所有的业务流公平地竞争网络资源,对IP包传递的可靠性、延迟等不能提供任何保证。而随着多媒体业务
网络给人们的生活和工作带来了极大的方便,但也使信息系统面临的新的威胁。安全审计系统是网络信息安全整体防护体系中重要环节,与其他安全措施相辅相成。它提供一个集中各种审
由于企业在信息化过程中缺乏一个整体规划,导致企业内出现大量的信息孤岛,不能有效地共享信息,更不能实现业务流程的协作和自动化。企业应用集成(EAI)应运而生。随着动态电子商
本文研究工作主要围绕以下2个方面进行: 第一、提出了一种基于健壮主成分分析方法的无监督异常检测方法。首先,引入了健壮距离估计以解决传统入侵检测方法对训练样本的离群
随着计算机网络与数据库技术的迅速发展和广泛应用,商业智能系统中的分析型处理(OLAP)在各种商业领域中扮演越来越重要的角色。随着数据处理技术在企业的成功应用,传统的OLAP数据
SAT问题(Satisfiability problem),是第一个被证明的NPC(Non-deterministicPolynomial Complete)问题,在计算机科学理论和应用中具有重要的意义。对于理论研究,它是计算复杂性理
随着Internet技术与多媒体技术的飞速发展,多媒体通信已经成为人们之间交流信息的重要手段,多媒体信息的安全与保密显得越来越重要。对于多媒体信息,如常用的图像信息,传统的加密
近年来,随着无线局域网(WLANWirelessLocalAreaNetwork)的高速发展和IEEE802.11标准的不断普及,在WLAN中如何对实时业务提供更好的服务质量(QoSQualityofService),引起了人们广
网格信息服务是网格系统中负责管理资源信息的一系列服务集合的统称,其中包括资源描述、资源发现、资源监控和资源推荐等。随着资源规模的日益扩大,资源信息总量急剧增加,如何高