论文部分内容阅读
随着信息技术的飞速发展,特别是大数据的出现,如何在海量数据中获取有益的信息,已成为数据分析和预测的研究热点.贝叶斯网络能够直观、形象地表达数据之间的依赖关系,已被广泛应用到机器学习、医疗诊断和信息科学等众多领域.在贝叶斯网络中,常常使用节点表示变量,使用有向边表示变量间的因果依赖关系.针对现有算法中存在的不足之处,本文提出了一种基于超结构的贝叶斯网络结构学习算法.全文的主要工作如下: 本文首先研究了贝叶斯网络框架学习.针对数据量较少或缺失情形下,基于条件独立检验学习贝叶斯网络框架时边的缺失问题,本文提出了一种有效地学习贝叶斯网络框架的算法.该算法首先进行边缘独立和一阶条件独立检验,然后利用节点间的必要路方法识别可能在条件独立检验阶段被删除的边,最后得到一个超结构,有效地避免了学习框架时,出现边的缺失问题.本文算法与已有算法进行了比较,实验仿真结果表明本文提出的算法在时间复杂度和网络框架的精确度方面都有明显的改善. 其次研究了小样本情况下贝叶斯网络结构学习.在样本量较小情况下,由于条件独立检验的高阶独立检验具有不可靠性,导致得到的网络结构的精确度偏低.对于这种问题,本文给出了一种基于超结构思想学习贝叶斯网络结构的算法,即Opt01HC算法.该算法首先利用超结构的方法构建一个无向图,它能够学习到适度冗余的边,很好地权衡了缺失边和冗余边的数量,然后采用搜索算法对得到的无向图进行边的定向,最后得到一个贝叶斯网络结构.在标准数据集ASIA、ALARM、INSURANCE上进行了仿真实验,结果表明该算法的学习效率和学习精度明显优于MMHC算法并且Opt01HC算法的精度随着学习数据量的增加而明显上升.