论文部分内容阅读
由波兰的Pawlak教授提出来的经典粗糙集理论,其研究的主要是针对完备的信息系统,且是建立在不可分辨这种等价关系之上的,这种分类对数据的完整性和精确性要求很高。然而当今的数据处理中常常会存在数据的缺失,因此研究粗糙集的扩展模型对粗糙集研究的发展具有极其重要的意义。本文则以不完备信息系统为研究对象,以粗糙集理论为工具,对不完备信息系统中的粗糙集理论进行了进一步研究。本文主要有以下两方面的创新内容:(1)基于容差关系的粗糙集模型在不完备信息系统中得到了广泛的应用,然而容差关系中存在着一些缺陷,如:在一个容差类中,容差类里面的元素和产生这个容差类的对象都是满足容差关系的,然而容差类里面的任意两个元素却并不一定满足容差关系,为了解决这个缺陷,本文重新定义了容差关系,即:相容关系;提出了最大完全相容类的概念,最大完全相容类里面的任意两个对象都满足相容关系;接着,提出了两个方法用于选择一个对象的最佳相容类,这个可以用于知识约简,对分别由容差关系和相容关系产生的论域上的覆盖进行了深入的研究和比较。最后,就一个医学上的决策系统进行分析,挖掘出了简洁的规则。(2)当不完备信息系统中同时具有遗漏型和缺席型未知属性值时,分析了Grzymala-Busse提出的由特征关系得到的特征类,发现特征类中并非任意两个元素都满足容差关系;基于这一点不足,本文在特征类中引入了最大相容块技术,提出了特征相容块的概念,不仅对基于特征相容块的粗糙集的基本性质进行了讨论,而且将特征相容块粗糙集与特征关系粗糙集进行了比较分析,研究结果表明,相比于特征关系的粗糙集模型,采用基于特征相容块的粗糙集模型可以获得更大的下近似集和更小的上近似集,从而提高了粗糙集的近似精度。