基于大型数据库的数据挖掘理论研究及应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:senkooqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
(1)回顾了数据挖掘的发展历史及其特点, 归纳总结了数据挖掘的理论研究现状和实际应用研究情况,分析了当前存在的问题. (2)基于从数据中提取关联规则的思想,结合数据仓库、OLAP、和概念层次关系,将关联规则扩展到多维多概念层次的提取. (3)基于粗集的数据挖掘方法中,生成的决策规则约简的算法往往只考虑到了决策规则的最少,忽视了所得到的规则的成本,该文通过引入目标决策(MOD)的方法, 较好地解决效用最大且决策规则最少问题,从而使粗决策能力更完善和实用.(4)将贝叶斯网络(Bayesian Networks)的方法用于不确定性知识发现,其中包括对数据完全和数据不完全情况下的变量概率分布和网络结构的构建,利用专家知识和现实存在的大量数据库信息来构造贝叶斯网络是NP-Hard难题. 该文提出了利用遗传算法(GA)解决构造最佳贝叶斯网络的思想,并给出了具体的算法. (5)基于动态遗传算法的贝叶斯网络知识发,开发了知识实现系统BG-KDD(Genetic algorithms-basedBayesian networkfor Knowledge Discovery inDatabase).系统用于对现实的大型数据库建模,以及对不确定性信息进行定怀和定量的分析,取得了满意效果.
其他文献
该文首先论述了房地产业在国民经济中的重要作用,分析了中国房地产业的发展现状 ,在此基础上,进行了中国房地产业市场的供求分析,对中国居民的购买力进行研究.房地产市场化程
该文从考察当前中国上市公司资产重组的特征入手,对比西方国家企业购并重组动因及效应,总结上市公司资产重组的现有模式:股权转让;上市公司扩张;上市公司剥离不良资产;资产交