论文部分内容阅读
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从数据库的大量数据中提取隐含的、未知的、具有潜在价值的信息和知识的过程。进行数据挖掘的方法有很多,基于粗糙集的数据挖掘方法便是其中之一。属性约简是基于粗糙集的数据挖掘过程中的关键步骤,获得高效、快捷的属性约简算法对基于粗糙集的数据挖掘领域具有重要的现实意义。基于可辨识矩阵的属性约简算法是目前众多属性约简算法中应用最为广泛的一种。本文在粗糙集理论的基础上,针对传统的基于Skowron可辨识矩阵属性约简算法中存在的不足,提出了一种新的基于浓缩布尔矩阵的属性约简算法,该算法主要在以下几个方面作出了改进:提出了浓缩布尔矩阵的概念。该浓缩布尔矩阵以布尔代数的形式有效解决了现有可辨识矩阵存储空间大、生成效率低等缺点;提出了一种新的分辨函数最小析取范式生成算法。该算法不仅能获得分辨函数所有最小析取范式项,并有效节省了存储空间,降低算法的时间复杂度。最后,通过实验对比验证了基于浓缩布尔矩阵的属性约简算法的正确性和高效性。针对实际问题中数据库中的数据是不断变化的这一情况,提出了基于浓缩布尔矩阵的增量式属性约简算法。该算法避免了每次从庞大的原始决策表进行约简的动作,实现了对决策表约简结果的动态更新与维护,从而提高了属性约简效率。最后,通过实例验证了当决策表动态更新时,该算法能够在已有属性约简的基础上正确获得更新后决策表的所有属性约简,有效减少了计算量,提高了算法执行效率。