论文部分内容阅读
智能决策支持系统(IDSS)是决策支持系统(DSS)引入人工智能技术后的产物,是目前DSS的前沿研究领域,数据挖掘是提高其决策支持能力的一种重要工具和手段,研究数据挖掘的相关理论与方法及其在IDSS中的应用具有重要的理论意义和实用价值。 数据挖掘是从大量的历史数据中发现隐含的、有潜在应用价值并最终能被人理解的知识的过程。在决策领域,人们所面对的数据往往具有不确定性和不完整性,从这类数据中发现知识是一个非常困难的问题。本文从数据挖掘的基本概念入手,分析数据挖掘过程中面对的不确定性问题的特点,在深入比较多种不确定性理论的优缺点情况下提出了应用粗糙集理论的解决方案,研究丁粗糙集理论的扩展模型及计算方法、数据预处理、知识约简、决策分析等问题。具体的研究内容如下: 1、粗糙集理论扩展模型。本文从对象的不可分辨关系出发,讨论了信息系统的经典粗糙集模型,并针对经典粗糙集模型存在的对噪音敏感等缺陷,提出了基于隶属度和微差距离的可变精度微差关系(VP-MD)模型,该模型不仅能够处理含有噪音的不完全信息系统,其结果也能反映大量数据所满足的统计规律,使粗糙集理论的应用范围更广、适应性更强。 2、VP-MD模型的计算方法。本文研究了基于VP-MD模型计算粗糙集理论所涉及的数字量和集合量方法,并针对最小属性约简和最小值约简这两个NP问题提出了基于属性上下文敏感度的启发式属性约简算法—CSBARK算法和基于值核的最小规则集求解算法。前者利用微差距离计算属性的加权特征差、利用互信息计算值差,从而求出各条件属性的上下文敏感度,该值既反映了对应的条件属性的重要性,同时还反映了该属性与其它属性的关联程度;后者利用值核在生成规则过程中的重要作用,结合推理过程中的逻辑关系求解最小决策规则集,并给出了规则的评价指标支持度和信度的计算方法。 3、本文从多方面研究了数据挖掘过程中的数据预处理问题: (1)连续属性离散化。本文将离散化问题转化为分割点的寻优问题,综合考虑多个属性之间的依赖关系,利用遗传算法寻找给定区间数的最优分割点,利用粗糙集理论的基本分类思想,删除冗余分割点。 (2)概念泛化。对常用的概念树爬升方法进行了改进,利用属性的分类能力控制概念泛化程度,防止过度泛化。 (3)空值估算。对于不完全信息系统,本文利用粗糙集扩展模型,在充分考虑数 合肥工业大学博士论文 摘 要 据相容性和属性依赖性的情况下,对缺失值进行了有效的估算,既防止了删除含有 空值的对象,使系统缺少典型性,又防止出现过多的、扩展的完全系统。 4、针对已获得的最小规则集和给定的新的决策对象,本文利用对象在规则集中 的满足情况研究了一种新的对象分类方法。 5、为了提高GDSS决策能力,本文提出了将粗糙集理论与层次分析法相结合的 思想,利用粗糙集理论所确定的属性间的依赖关系,分析应用系统运行所积累的大 量数据中各决策因素、决策者对决策目标的影响,构造具有完全一致性的个体判断 矩阵和综合判断矩阵,建立自学习系统,克服决策者主观因素对决策结果的影响。 6、在上述工作的基础上,本文研究了基于粗糙集数据分析(RSDA)的智能决策 支持系统的体系结构,详细论述了RSDA-DSS的设计与实现,该系统可根据用户的 定义完成多种粗糙集模型的数据分析方法;通过实例分析了RSDA在决策支持系统 方面的应用,同时将该系统应用于疾病治疗方案的优化,拓展了RSDA的应用领域。 论文研究成果在一定程度上解决了从不确定信息系统和不完全信息系统中发现 知识的问题,为RSDA在决策中的应用提供了更加广阔的空间。