论文部分内容阅读
粗糙集(Rough Set)理论是一种主要处理不完整、不确定知识的数学工具,是1982年由波兰数学家Z.Pawlak最早提出的。目前,粗糙集理论已广泛应用于数据处理、智能控制、决策分析等领域。粗糙集属性约简是粗糙集理论研究的核心内容之一,有许多学者致力于属性约简算法的研究。人们研究的重点是以属性重要度作为启发式信息的属性约简算法。为此本文定义了一种新的属性重要度,在此基础上,给出了粗糙集属性约简的一种新算法。另外由于粗糙集的属性约简结果一般不唯一。许多属性约简算法将约简结果的评判标准定为约简后属性数最少,或者是得到的规则最简,或约简量最大。但属性子集中各个属性间的相关性也很重要。基于这种思想,本文采用属性相关性去衡量属性子集中属性间的相关程度,并选择平均相关性最小的属性集为最佳约简结果。属性约简算法大都建立在条件属性对决策属性的信息量基础之上的,它们的出发点都是一样的,只是采用的标准有所不同。近年来,有些学者提出新的属性约简定义,即:基于系统熵的属性约简定义。他们认为只关心条件属性的分类能力是不够的,决策属性的分类能力也应该充分考虑。这种属性约简定义同时考虑到了条件属性和决策属性的分类能力,是一种较为周全的属性约简模型。本文从系统熵的角度出发,改进了原先的属性重要度定义,给出了新的属性重要性的度量方法,并构造了相应的启发式算法。模糊粗糙集是粗糙集的重要延伸。所以对模糊粗糙集属性约简的研究就显得十分有必要。本文提出一种基于系统熵的模糊粗糙集属性约简算法。最后,基于优势关系的粗糙集模型,是粗糙集的重要拓展。针对优势关系下的正域约简,本文提出一种改进算法,即差别矩阵法。它能得到和基于属性重要度算法一样的约简结果。