基于贝叶斯网络数据挖掘算法的研究

被引量 : 11次 | 上传用户:lonlychanging
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库和计算机网络的广泛应用,加之使用先进的自动数据生成和采集工具,人们所拥有的数据量急剧增大,利用信息技术生产和搜集数据的能力也大幅度提高,如何有效地利用和处理信息成为当今世界共同关心的热点课题。由于数据库技术、人工智能和数理统计等技术的不断发展与融合,数据挖掘技术应运而生。数据挖掘是一门新兴的交叉学科,也是现代科学技术相互渗透的必然结果,基本目标就是从大量的数据中提取隐藏的、潜在的和有用的知识和信息。这一技术自20世纪末提出以来,引起了许多专家学者的广泛关注,并应用到金融业、零售业、医疗保健和政府决策等各个领域,取得了良好的社会效益和经济效益,具有广阔的开发前景和应用前景。 贝叶斯网络是概率论与图论相结合的产物,提供了不确定性环境下的知识表示、推理、学习手段,可以完成决策、诊断、预测、分类等任务,因其良好的可理解性和逻辑性成为数据挖掘的重要方法。 本文致力于贝叶斯网络的理论和算法的研究,全文研究了如下几个问题: 1.贝叶斯网络和数据挖掘的结合。贝叶斯网络起源于贝叶斯统计学,数据挖掘本质上具有很强的统计色彩,促成了二者的结合。 2.贝叶斯网络的推理。通过在网络中进行推理,可以得到任意节点间的依赖关系,从而确定数据库中节点所表示事件间的联系,同时对事件的发展进行预测。针对不同的网络,可以采用不同的推理算法,以加快推理速度,提高计算效率。联合树算法以其容易理解,适用范围广等特点成为目前应用最多的精确推理算法。 3.贝叶斯网络的学习。贝叶斯网络的学习是数据挖掘中非常重要的一个环节,是将先验知识和模型评价融入训练数据,获得数据中隐藏的拓扑结构和参数的过程。贝叶斯网络学习分为结构学习和参数学习,其中结构学习是贝叶斯网络学习核心内容。主要对三阶段结构学习算法的原理、实现过程和计算复杂度进行讨论,并利用典型数据库对算法进行验证。参数学习分为:完整数据和不完整数据学习两种,针对不同情况可以采用不同的学习算法,从数据中学习网络的条件概率表。
其他文献
经济的发展使得人们越来越注重服装的个性化和合体性,服装定制作为能满足这种趋势的生产方式将成为未来服装业的发展重点。传统的量体裁衣模式存在许多局限性,形不成规模效益
本文运用恒压阳极氧化法在Ti6Al4V(TC4)合金表面制备了彩色阳极氧化膜,并讨论了各种工艺参数对氧化膜色彩均匀性以及膜层性能的影响。采用环境扫描电子显微镜(SEM)、X射线光
由于隧道投资大、周期长、风险高等技术经济特点,为成本控制带来较高的难度。在我国,隧道工程施工成本管理存在不少的问题,企业的价值意识淡薄,价值创新功能不足,缺乏一套科学合理
本文首先回顾了激光电源的发展,铒YAG激光的应用,分析了激光采血的技术。通过仿真和实验,设计了铒YAG固体激光器采血仪的电源电路和控制系统,并详细分析了它的工作原理。脉冲
本文主要对Al2O3支撑体和A12O3膜的制备进行了探讨。首先,根据文献报道,综述了多孔陶瓷支撑体以及陶瓷膜的主要制备方法,对比了各种方法的优缺点,分析了国内外发展现状。在此
杂填土成分和工程性质复杂,若处理不当会因不均匀沉降造成其上构筑物的破坏。论文以位于垃圾填埋区域的铁路站场工程实例为背景,研究渣土桩加固杂填土地基的作用机理,并通过
改革开放以来,随着国家经济和社会的高速发展,区域化和城市化的进程加快,未来20年将是中国城市化进程进一步加速的时期。随着城市的发展,城市住区正逐步向郊区化发展。杭州被
目的:探究奥扎格雷钠与丹参川芎嗪联合治疗急性脑梗死的临床疗效与安全性。方法:选择急性脑梗死患者60例,分为对照组与研究组,每组30例。予奥扎格雷钠作对照组,予奥扎格雷钠联
夏丐尊是我国现代著名的文学家、翻译家、出版家,也是一位语文教育史上著名的语文教育家。作为从事语文教育研究工作长达近40年的语文学界老前辈,他为后人留下了丰富的语文学
应力或应变对骨生长和骨折愈合起着十分重要的作用,国内外已经形成了研究的热点.本文介绍了自1976年以来的1/4世纪中,我们几个单位合作在对骨生长和骨折愈合的生物力学研究中