论文部分内容阅读
粗糙集理论是波兰数学家Pawlak在1982年提出的一种处理不精确,不完备的模糊数据的数学工具,用来挖掘海量数据中隐含的决策和规则等潜在的关键信息。近年来,粗糙集理论在国内外研究中取得了巨大的进展,在机器学习,知识获取,决策分析,模式识别等众多重要领域有着广泛的应用。知识约简是粗糙集理论研究的重要内容。约简可以减小数据规模、降低数据维度,在当今知识爆炸的时代背景下显得尤为重要。现有的许多约简算法都是基于静态数据的,无法满足现实中数据动态增加的需求,因此讨论和探索增量式的约简算法具有重要的理论意义和应用价值。本文在粗糙集理论的体系下,对增量属性约简进行了深入研究,主要工作如下:(1)对基于分辨矩阵的增量属性约简算法进行深入研究,分析三种典型算法的原理,并分别给出它们的优势与不足,为增量约简算法在实际中的应用提供了一定的理论指导。(2)从信息论的观点出发,建立对象动态增加情况下条件熵的变化机制,根据决策表更新前后约简属性对新增对象的分辨情况,得到增量后约简的变化的三种情况,并以此为基础设计一种新的基于条件熵的增量属性约简算法,该算法可以快速的计算出更新后决策表约简,为计算增量约简提供了新的途径。本文对决策表下增量属性约简的算法进行了深入研究,取得了一些有意义的结论,这些结果将丰富粗糙集理论,特别是对基于粗糙集的增量属性约简求解方面有一定的借鉴作用。