基于MRMR的贝叶斯网络结构学习算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:jiangfan520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络是一种概率图模型,能够高效表示随机变量之间复杂的独立依赖关系;即使在数据不完整的情况下,仍然具备高效的推理能力,因此越来越广泛的用于决策、诊断和复杂系统的控制等领域。如何从原始数据中学习到贝叶斯网络是其解决问题的前提。贝叶斯网络由结构和参数组成,其中结构学习是核心。本文研究了贝叶斯网络的理论知识和学习贝叶斯网络的相关算法,分别在完整数据集和缺失数据集下,结合最大相关和最小冗余特征选择技术,重点研究贝叶斯网络结构学习算法。其研究内容主要体现在以下几个方面:1)针对完整数据集,改进了基于节点次序的最大相关和最小冗余贪婪贝叶斯结构学习算法(OMRMRG),该算法引入了最大相关和最小冗余特征选择技术,并采用局部贝叶斯增量评分函数,在有限的数据集上提高了算法的精度和准确性。但由于是随机产生初始节点的次序,因此增大了结果的不确定性。本文提出了一种生成优化的节点初始次序的方法,在得到基本有序的节点初始次序后,再结合近邻交换算子进行迭代搜索,能够在较短的时间内得到更加正确的贝叶斯网络结构。实验结果表明了该方法的有效性。2)针对缺失数据集,对于BN-GS算法中的随机初始化缺失数据和随机生成节点次序带来的不确定性,利用节点次序预排序算法产生初始次序;对于每个缺值的节点变量,使用其在整个数据样本中出现次数最多的那个取值作为初始化,加快了收敛的速度,提高了为边确定方向时的正确率。基于初始化后的完整数据,应用克鲁斯卡尔算法建立最大权重生成树,并按照上述的节点次序确定生成树中边的方向。在使用吉布斯算法迭代修正数据的过程中,赋予了局部参数一个更准确的修正幅度。改进后的BN-GS算法能够在较短的时间内收敛到平稳分布,得到了较优的结构。实验结果表明了该算法的有效性和正确性。3)研究了基于评分搜索的方法和基于约束的方法,并通过实验进行了比较与分析。与基于评分的方法相比,基于约束的方法更为直观,且速度也比较快,有时得到的箭头可以理解为因果关系;但是独立性检验没有评分函数准确,而且一旦出错,就会对后面的计算产生很大影响。
其他文献
随着互联网技术的快速发展,信息的结构也变得多样化。文本数据不但包含内容信息,也包含了共同作者关系(coauthors),相互引用关系(citations),地理位置和时间等附加信息,这样就构成了多
进化算法已经用于逻辑电路设计很多年。相比于传统的逻辑电路设计方法,进化算法有其独特的吸引人之处。使用进化算法设计电路不需要太多专业的背景知识,具有智能化的特点。逻辑
数十年来,计算机体系结构技术一直在不停的演化和发展着,而来自上层的应用需求则是一个重要的驱动来源。随着一些新兴应用的不断出现,传统的高性能通用处理器已经难以发挥其功效
盲签名是一种特殊的数字签名,签名者无法得知待签名消息的内容。盲签名的完全盲性使得签名者对签名消息不可控,并且会导致密钥管理变的复杂。部分盲签名是盲签名的一种拓展,
现如今,WCDMA协议已经成为了两大主流通信体制的一部分并越来越受到人们的关注。而对于无线通信系统来说,呼叫流程能否成功建立是一个很关键的问题,可以称得上是整个通信系统
近些年,信息通信技术取得了飞速发展,消费类电子产品发生了很大的变化,正在朝着互联、互控和互通的方向发展,人们的生活迈入全新的智能时代。智能手机、平板电脑、汽车电子设
为了方便人们的阅读习惯、网页的排版格局以及网站的商业目的,网页中往往充斥了许多与网页正文无关的内容,如导航条、相关链接和商业广告等信息。无关信息的存在,对网页的检索、
首先,马太效应或累积优势(CA)在各个领域都被广泛研究。它被认为是造成劳动工资、教育,健康以及职业的不平等因素,甚至很大程度上是影响科学活动如拨款申请、期刊出版、同行的认
在当代人类生活中,选举已经成为每个公民一项必不可少的政治活动。在选举过程中,人民参与政治主要是通过投票来实现的。因此,投票成为民主国家下广泛的政治行为之一。而这载
关键词抽取是自然语言处理中的基础与核心技术。通常对非结构化文本的自动处理,如自动文摘、文本聚类、自动问答等,均需要先进行关键词抽取。关键词是表达文档主题意义的最小单