论文部分内容阅读
因果贝叶斯网络也被称为信念网络,是基于概率图理论的一种不确定性知识表达和推理模型。它在数据挖掘、模式识别、数据压缩、基因信息调控、图象处理、工业制造等方面都有重要的应用。因果贝叶斯网络结构作为贝叶斯网络参数学习、推理、分类的基础,它的学习方法显得特别重要。到目前为止,因果贝叶斯网络的结构学习是一个NP难题。本文的内容可分为以下几部分:(1)介绍了因果贝叶斯网络结构学习的研究背景、现状以及基本理论。(2)针对爬山算法和GS算法在学习因果贝叶斯网络结构时很难得到近似全局最优结构和搜索次数多的问题,提出了一种基于2测试的贪婪搜索结构学习算法CIGS算法。在爬山算法和GS算法在学习贝叶斯网络前,对初始化网络进行了全局性的处理,先通过2测试学习得到一个无向图,然后用条件相对平均熵对这个无向图判别方向,使得学习到的网络中边的方向更加准确,最后用GS算法进行学习。实验证明CIGS算法与爬山算法、GS算法相比能够得到更优的近似全局最优结构,减少了搜索次数使得算法在时间性能上更高效。(3)针对独立性测试算法,如PC算法、TPDA算法由于计算性能的限制,很难在多结点的大数据集上运行的问题,引入了d-分离树的概念,应用d-分离树把大的贝叶斯网络分解为多个小的网络,然后对这些小网络采用独立性测试的方法进行学习,再把学习得到小网络整合起来,基于此,提出了一种基于d-分离树分解的GES因果贝叶网络结构学习改进算法,这种因果贝叶斯网络结构学习算法很好地结合了搜索评分和独立性测试这两类结构学习算法的优点,能够更加有效地学习因果贝叶斯网络结构。(4)对贝叶斯网络结构的主动学习领域进行了研究。分析了贝叶斯网络的因果强度和三种扰动模型,最后分别采用互信息、对称熵、不对称信息熵来选择扰动节点进行结构学习,并实验验证了这几种方法的优劣。分析了这几种方法用于因果贝叶斯网络结构学习的精确程度,还提出了用互信息和不对称熵结合的方式选择扰动结点进行结构学习的方法。实验表明,这种方法针对数据集较少的小规模网络上很大程度上提高了因果贝叶斯网络结构主动学习的准确程度。