基于粗糙集的启发式属性约简与规则提取研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:brxdq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种新的刻画不完整性和不确定性的数学工具。知识约简是粗糙集理论研究的核心问题之一。目前,粗糙集理论正在被广泛应用于人工智能、模式识别等很多领域。本文对属性约简与决策树规则简化进行了深入研究: 针对不一致决策表,为克服区分矩阵方法时间复杂度随系统大小增加而指数增长的缺陷,以知识的包含度为基础,将一致与不一致对象分开,给出分布约简的数学判定定理,设计了一种求分布约简的启发式算法。实践表明该方法能够获取较小的约简。 为弥补现有信息论方法的局限性,定义了一种新的条件熵概念,并且给出了以不等式为条件的约简判定定理,提出了一种相对属性约简的启发式算法。实例分析的结果表明,该方法提高了运行效率,有助于搜索最小或次优知识约简。基于上面的思想又提出了基于决策熵的约简算法,实验结果表明该算法也能取得较好的效果。 分析了基于正区域方法的不足,提出了决策强度的代数定义,并证明了知识的决策强度随信息粒度变小而非单调递减的规律,设计了基于决策强度的约简算法。UCI离散数据集实验比较的结果表明,该算法计算直观有效。 针对现有值约简算法提取规则仍存在冗余与计算复杂度较大等问题,引入决策树分类规则学习方法,定义了一种能反映决策能力实质的新的条件熵,对传统启发式方法中选择属性的标准进行改进,构造决策树,设计规则约简过程。该方法的优点在于构造决策树与提取规则之前不进行属性约简,也能获取简洁有效的规则。为弥补知识粗糙熵的局限性,提出决策熵概念,以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树,简化规则。通过实例分析说明了该算法的有效性。
其他文献
中国手语环境下的自然语言处理是人工智能的一个重要分支,而手语环境下的汉语自动分词是中国自然语言处理的一项基础性工作,也是中文信息处理的一个重要问题,同时也是实现自然语
伴随着经济全球化和科学技术的迅猛发展,企业的生存环境和生存方式发生了巨大的变化。在这样的情况下,许多企业为了获得更高的利益,纷纷调整自己的策略,寻求合作的利益、创造
生物信息学是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科,它是整个生命科学发展的重要组成部分,己成为生命科学研究的前沿。生
随着计算机技术的飞速发展,计算机动画、科学计算可视化和虚拟现实成为计算机图形学领域中三大重要技术,而三维真实感图形又是这三大技术的核心内容。OpenGL凭借其强大的渲染功
由于Web Service具有平台和语言的独立性,使得它受到广泛的应用,目前Web Service已经成为当今Web应用系统中不可缺少的重要内容之一。对于台式PC来说,目前已经有比较成熟的Web S
随着信息技术的高速发展,信息资源的规模愈发庞人,导致管理难度大大增加,因此需要采用有效的知识管理方法来处理海量信息。由于本体提供了对领域知识的共同理解,确定了该领域内共
粗糙集理论是继概率论、模糊集理论、证据理论之后的又一个处理不确定性的数学工具。知识约简算法是粗糙集理论的核心内容。寻找决策信息系统的最优约简或全部约简是NP问题,
学科分类体系可以揭示科学发展的规律,并能在一定程度上预测学科进一步发展的趋势,有助于科研管理工作者制定政策。随着科学知识迅猛增长,学科分类体系动态性日益明显。如何构建
长期以来,电信企业大量而详尽的电信业务数据只被简单的应用在各种业务系统中,而没有被更有效的开发利用。随着电信市场的竞争日趋激烈,如何利用这些数据为电信业提供决策支持服
决策树方法是数据挖掘的重要方法,通常用来形成分类器和预测模型。决策树方法包含多种不同的算法,其中ID3算法是决策树方法的典型代表,是决策树生成最常用的具体实现方法,它利用