论文部分内容阅读
经典粗糙集理论以完备系统为研究对象,通过等价关系将论域划分为互不相交的等价类。等价关系的概念虽然至关重要,但是由各种原因所导致的信息的缺失和不精确性使得无法利用属性值来建立等价关系,从而经典粗糙集模型的应用受到了限制。在不完备信息系统中,建立适当的关系以适应不完备信息的处理是解决信息不完备问题的重要途径。现有的缺失值信息系统中的粗糙集模型,包括M. Kryszkiewcz提出的基于相容关系粗糙集拓展模型[9]、J. Stefamowski和A. Tsoukeas提出的基于非对称相似关系的粗糙集拓展模型[10]、王国胤提出的基于限制容差关系粗糙集拓展模型[11]以及梁美莲等人提出τ限制容差关系粗糙集拓展模型[12],这些模型都存在着不足之处,因此本文对这些现有的模型进行了深入的研究,并以具体的实例对三种模型在对象分类时的优缺点加以比较,讨论。本文在总结和借鉴前人经验的基础上,针对更一般的数据系统——多值信息系统的特殊性和一般性,提出了基于相似度容差关系的粗糙集模型。首先,定义了一个新的相似度函数用于描述信息系统中两个对象之间的属性相似度,并研究了相似度的有关性质。接下来,以梁美莲等人提出τ限制容差关系粗糙集拓展模型[12]为基础,在相似度的基础上定义在多值信息系统中的容差关系,即如果对象x和y的所有属性值都有可能相同,并且属性相似度大于αi的比例大于τ,其中αi和τ分别是设置的阈值。这是基于概率论的思想,通过两个样本对象在所有属性下相似的概率来替代两个对象间的相似程度进而建立相容关系。接着本文进一步研究了多值信息系统中基于相似度容差关系的粗糙集模型的有关性质,证明了它是基于现有二元关系在多值信息系统中的模型推广,也是多值信息系统粗糙集模型的一般情形。最后研究了多值信息系统中的基于相似度容差关系的粗糙集模型的知识约简和规则提取。