论文部分内容阅读
粗糙集理论自上世纪80年代初被提出以来,发展十分迅速.它作为处理知识模糊性和不确定性的一种重要的数学工具,受到越来越多研究人员的重视,已经在数据挖掘、机器学习、模式识别等领域得到广泛应用,其中属性离散化和规则获取是很重要的一个方面.本文围绕粗糙集理论在决策表中的属性离散化、规则获取等方面做了一些探索性的工作,取得了一定的成果.主要研究成果如下:(1)提出了一种能够充分利用决策信息系统的特征的分辨矩阵,能有效地度量离散断点的重要性,并以离散断点的重要性作为启发信息构造了一种离散化算法.理论分析与实验结果表明了该算法的有效性.(2)设计了一种改进的规则获取算法.该算法能够处理含有不一致实例的决策表,提取不一致的规则.算法采用一阶向量的分辨度作为启发信息,可以逐渐减少所需的存储空间,因此适合处理大规模数据集.实验结果表明了该算法的有效性.这些研究成果将丰富粗糙集理论,为大规模复杂数据的知识获取提供有效的技术手段.