论文部分内容阅读
由波兰学者z.Pawlak于1982年提出的粗糙集理论是一种新的处理不确定性知识的数学工具。经过二十余年的研究与发展,粗糙集理论已经在理论和实际应用中取得了长足的进展。由于该理论不依赖于所需处理的数据集合之外的任何先验信息,所以对不精确、不确定、不完整的信息和知识具有很强的分析处理能力。特别是由于八十年代末和九十年代初在知识发现等领域的成功应用,从而受到了世界各国学者的广泛关注。目前,粗糙集理论已被成功地应用在人工智能、机器学习、数据挖掘、决策支持与分析、过程控制、模式识别、故障检测等领域。本文围绕信息系统中的知识约简与知识发现问题。主要作了如下几方面的研究工作:1.属性核是所有约简的交集,从而现行的许多属性约简算法,都是以属性核为起点,利用启发式信息(如:相对信息量,相对重要性等)逐步对属性核中添加相对最重要的属性,直到得到原信息系统的一个约简为止。本文以等价矩阵为工具,利用属性分组的方法,提出了一种新的计算属性核的算法,该算法避免了传统算法中重复计算等价矩阵交运算次数多的缺点,降低了常规算法的时间复杂度。2.知识约简是在保持知识库在某性质不变的条件下,删除其中不相关或不重要的属性。目前,许多学者对知识约简做了深入的研究,并取得了很多成果。但是,这些研究大多是在完备的信息系统、不完备的符号值信息系统中进行的。由于种种原因,在现实生活中还存在一种不完备模糊目标信息系统,即这种信息系统的条件属性是不完备的,而目标属性是模糊的。对于这种信息系统至今很少学者做深入的研究。本文基于不完备信息系统中的相容关系,提出了不完备单模糊目标信息系统中的近似约简,ε约简等概念,其中ε约简是对近似约简的一种拓广,还提出了不完备多模糊目标信息系统的近似约简、分配约简等概念,并且给出了各种约简相应的辨识矩阵,从而为计算各种约简提供了有效的方法。3.粗糙集理论的研究对象主要是信息系统,对于信息系统的知识发现主要是指概念的发现,对于目标信息系统的发现主要是指决策规则的发现。不论是什么类型的目标信息系统,目前对目标信息系统的研究主要是对条件属性进行各类型的属性约简,并由约简得到决策规则,这样得出决策规则个数非常有限。本文引入了一种集合向量空间上的加权包含度,并基于该包含度提出了一种协调目标信息系统中决策规则的融合方法,该方法可以得到协调目标信息系统中的全部决策规则,即不论什么样的条件属性的取值组合情况,根据该方法都可以给出相应的决策值。