论文部分内容阅读
(1)回顾了数据挖掘的发展历史及其特点, 归纳总结了数据挖掘的理论研究现状和实际应用研究情况,分析了当前存在的问题. (2)基于从数据中提取关联规则的思想,结合数据仓库、OLAP、和概念层次关系,将关联规则扩展到多维多概念层次的提取. (3)基于粗集的数据挖掘方法中,生成的决策规则约简的算法往往只考虑到了决策规则的最少,忽视了所得到的规则的成本,该文通过引入目标决策(MOD)的方法, 较好地解决效用最大且决策规则最少问题,从而使粗决策能力更完善和实用.(4)将贝叶斯网络(Bayesian Networks)的方法用于不确定性知识发现,其中包括对数据完全和数据不完全情况下的变量概率分布和网络结构的构建,利用专家知识和现实存在的大量数据库信息来构造贝叶斯网络是NP-Hard难题. 该文提出了利用遗传算法(GA)解决构造最佳贝叶斯网络的思想,并给出了具体的算法. (5)基于动态遗传算法的贝叶斯网络知识发,开发了知识实现系统BG-KDD(Genetic algorithms-basedBayesian networkfor Knowledge Discovery inDatabase).系统用于对现实的大型数据库建模,以及对不确定性信息进行定怀和定量的分析,取得了满意效果.