论文部分内容阅读
数据挖掘研究如何从大量的数据中智能地、自动地抽取有价值的知识和信息,是当前人工智能中非常活跃的研究领域。粗糙集理论是近年来发展起来的一种有效地处理不精确、不确定的软计算工具,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功。本文在经典粗糙集理论的扩充方面和决策表的知识约简方面进行了深入的研究,并取得了很好的理论和实验效果。因此,开展这方面的工作具有重要的理论意义和应用价值。 本文主要基于粗糙集理论和关系数据库的结合以及知识约简在决策表中的理论和应用研究。 在不完备系统下的粗糙集理论的扩充方面,提出了一种类相似关系的粗糙集模型,该模型通过对域值的等价划分,可对对象进行重新分类。 在粗糙数据查询方面,分析了各种粗糙查询方法的优缺点,提出了一种基于SQL语言的粗糙数据查询方法,该方法可以提高查询效率,减少存储空间,具有较好的应用价值。 在知识约简方面,提出了一种基于信息熵的决策表的知识约简算法,该算法通过熵对属性的重要性进行了有效的度量,经过实际系统的运行测试,该算法可得到决策表的最小约简。 本文从多值信息系统和决策表中的知识约简两个方面入手,对粗糙集理论的推广应用做了有益的探索。但是,粗糙集理论与关系数据库理论的结合正处于发展阶段,它们之间的关系还有许多问题值得研究。本文的研究工作是一个尝试,相关工作还有待进一步深入。