论文部分内容阅读
粗糙集理论是继概率论、模糊集理论之后的,由波兰科学家Z.Pawlak于1982年提出的又一处理不确定性的数学工具。粗糙集理论建立在论域中的不可分辨关系之上,该理论的优点是不需要任何附加的信息或先验知识,就能有效地分析和处理不精确、不完整和不一致的数据,粗糙集理论已成为当前计算机、人工智能、信息科学等领域的研究热点之一。
在粗糙集理论中,知识约简是其主要内容,约简分为属性约简和属性值约简,相对于属性约简来说,属性值约简要简单得多,所以研究较少,而属性约简到目前也没有完全解决,所以仍是粗糙集理论的研究重点。通常的知识约简一般就理解为属性约简。
本文首先对完备信息系统下经典的粗糙集精度定义的局限性进行了分析,提出了一种改进的粗糙集精度的定义,根据这种定义给出了基于属性对决策分类的新的重要性的概念,并构造了基于这种重要性的属性约简算法:其次给出了基于条件属性相对决策属性的条件信息量的属性约简算法;在对属性对决策分类的重要性和条件信息量的定义进行了分析后,提出了一种新的完备信息系统下基于调和平均的属性重要度的定义,构造了相应的属性约简方法,并将之推广到了不完备信息系统中;论文最后研究了经典粗糙集和Ziarko<[20]>提出的变粗度粗糙集中的不确定性的度量问题,提出了一种基于变精度模型的新的粗集精度的计算方法,这种方法对于处理带噪声的决策表有较好的效果,基于这种新的粗集精度的计算方法,论文设计了相应的决策树的构造算法。