论文部分内容阅读
信息系统中的每个属性代表对论域中对象的区分或分类的能力,在属性集中往往存在冗余的信息,如何找到一个不冗余且保留原属性集的全部区分信息的极小或最小属性集是信息处理的重要课题。Z.Pawlak的粗糙集理论可以完美的处理基于完备信息系统上的不可分辨关系,对于其他类型的信息系统,粗糙集理论无法直接处理,人们提出很多方法扩展粗糙集理论到其他类型的信息系统上。 区间信息系统的存在是由于在实际的问题中,信息系统的属性值往往无法精确测定,而是落在某个区间上。对于区间信息系统,已经有包括基于区间包含的偏序关系,区间相似度关系引入阈值参数转化为相容关系等处理方法。前者的适用范围较小,因为区间值往往不是互相包含的。后者的区间量之间的相似性是基于区间的重叠区域大小定义的。 本文首先分析区间量的测量过程,根据误差理论定义了一种能够合理反映两个区间量相似程度的相似关系。定义区间量的相似性度量,将属性集映射到论域笛卡尔积上的一个模糊集簇,建立了基于区分度矩阵的属性约简理论,讨论了其特点,提出了将区分度离散化的观点,探讨了它对于系统鲁棒性的意义。最后设计了基于属性重要度的约简算法并通过实例验证了其有效性。