论文部分内容阅读
粗糙集理论是一种处理不精确性、不完备性和不确定性问题的重要数学工具。由于经典粗糙集模型的分类条件是一种严格的不可分辨关系,无法直接处理混合型数据和准确表达生活中的一些模糊概念,导致在实际应用中存在一定的局限性。因此,粗糙集与其他数学理论结合的粗糙集扩展模型也就应运而生,并且广泛地应用到实际问题的解决中。属性约简,作为粗糙集扩展模型研究的核心内容之一,在处理信息化时代的不确定性问题中起到了关键作用,其可以在保持分类能力不变的前提下剔除原属性集中冗余或无关的属性,提高模型的分类性能。本文针对经典粗糙集模型在实际应用中等价关系的严格性造成需要离散化数据而使得信息丢失以及无法同时表达决策问题模糊程度的缺陷问题,开展了基于粗糙集扩展模型的属性约简算法研究。本文主要研究工作如下:1.针对经典粗糙集模型无法直接处理多标记混合型数据和多标记数据中标记空间存在标记强弱性的问题,提出了多标记邻域粗糙集模型及其属性约简算法ARNRS-ML。该模型利用样本到其异类样本和到其同类样本平均距离的差值对标记赋予权重,挖掘了标记对样本的区分性强弱,并在邻域粗糙集框架下提出了新的正域计算方法,有效提高了正域的计算效率。所提方法克服了经典粗糙集模型在处理混合型数据时需要离散化操作从而丢失重要信息的缺陷。通过在多标记数据集上进行实验和比较分析,结果表明ARNRS-ML算法的分类性能明显优于其他多标记属性约简算法。2.针对多标记数据的高维性和数据类型的复杂性对分类性能造成干扰的问题,提出了多标记变精度模糊邻域粗糙集模型和属性约简算法FNRS-ML。该模型利用参数化的模糊邻域粒定义了多标记模糊决策和决策类,并结合粗糙集包含度定义了多标记变精度模糊邻域近似空间,解决了经典粗糙集模型在上、下近似计算时的严苛性。在不同领域的多标记数据集上进行了大量的实验,结果表明与当前流行的多标记属性约简算法相比,FNRS-ML算法不仅可以有效减少属性空间的维数,而且能获得更高的分类性能。3.针对经典粗糙集无法同时表达生活中决策问题的接受、反对和犹豫的程度,以及大数据时代的实际应用中数据属性维数增多,决策耗时增加的问题,提出了基于包含度的单值中智粗糙集模型及约简算法。该模型首先定义了单值中智集的包含度公式和相关基础概念,其次加入变精度参数定义其近似算子,使得实际决策问题更合理,最后利用具体实例说明所提算法对维数高的数据进行预处理,不仅可以减少决策过程的时间消耗,还有利于处理信息系统中的不确定信息,同时使得单值中智集对于决策问题的解决更具有实际意义。