论文部分内容阅读
人工生命的研究是当前的研究热点之一。贝叶斯网模型也以强大的知识表达和推理能力成为目前数据挖掘领域中的一项重要的工具。本文主要研究贝叶斯网在基因选择的进化过程中的应用。首先,通过对贝叶斯网学习算法的研究,提出了改进的贝叶斯网学习算法E-算法,并在通用的ALARM数据集上的实验表明,E-算法有很好的学习结果。在此基础上,本文通过模拟人工生命中的物种生存和竞争,给出了基于遗传算法的人工染色体和人工基因生成的人工生命模型(ALGAE),并获取该进化过程中存活的物种个体的基因染色体,将其作为人工基因的数据库。最后一步,采用E-算法<[41]>对人工基因数据库进行分析,找出基因选择中各基因间的关系图,给出易于分析和理解的贝叶斯网图形描述。本文得主要贡献由以下三方面:
1.在基于评分和约束相结合r的混合算法进行贝叶斯网结构的研究中,提出了两点改进:1)针对传统基于约束的学习算法中高阶独立测试运算复杂度高的局限,提出了基于统计的0阶、1阶和2阶的低阶独立测试;2)针对已有的搜索算法未考虑局部启发性信息的不足,提出了根据每个结点与其父结点相互信息大小关系进行排序,作为搜索过程的启发信息。实验结果表明,与传统方法对比,在保证精度的同时,本方法能大大提高提高了学习效率。
2.本文通过模拟基于“优胜劣汰,适者生存”自然法则竞争机制的人工生命模型,设计了基于遗传算法的人工生命实验程序ALGAE,其中包括一些基本的生态行为和进化规律,进而研究物种灭绝等现象。其目的是为了寻找基因选择的生物进化、物种选择过程中的适于生存的“规则”。ALGAE收集了进化过程的适应个体的人工基因和人工染色体,获得了基因选择过程生存者的基因数据库。此外,本文也将ALGAE应用于商业竞争模型,通过模拟实验结果,表明该商业模型在商业竞争的策略选择中也有广泛的应用前景。
3.本文提出采用贝叶斯网对与人工基因数据库进行分析研究,其目的是为了找出关键决定个体生存的“规则”。贝叶斯网模型是一种处理大量不确定数据的有效工具,能够直观而清晰的描述出变量间潜在的规律。我们采用以E-算法为核心的贝叶斯学习算法程序BANANA对人工基因数据进行分析,通过贝叶斯网结构建模,清晰、直观的给出基NN择的进化过程中生存者的基因之间的关系,进一步给出生物物种基NfN相互作用和影响的规律。
实验结果表明,ALGAE和BANANA两个程序能够很好的独立运行,并能结合运用给出基NN择进化过程中适合生存基因的图形描述。也就是说,贝叶斯网模型在进化过程的基因选择中可以得到有效的应用,在商业竞争、生态系统等的应用中,它将以基因的形式有效的对“竞争-淘汰”的选择过程中的生存规则进行描述,也就是本文主要创新之处。