论文部分内容阅读
近十年,随着分子生物学的飞速发展,系统发育分析也逐渐进入分子水平,从而形成了一套完整的利用生物体的DNA序列或蛋白质序列为主要内容的分子发育分析理论和方法。构建系统发生树成为系统发育分析的常用研究方法之一。如何利用生物体的DNA序列构建高效、准确的物种系统发生树,是研究物种之间系统发育关系的一个至关重要的环节,其过程主要包括三个步骤:1).分子序列或者特征提取;2).构建系统发生树;3).搭建系统发生树评估平台。本文正是围绕上述三方面内容开展如下研究:(1)基于DNA条形码的系统进化树构建方法目前还没有公认的利用DNA全基因组序列构建系统发生树的方法。现在构建系统发生树的方法大部分都是基于序列比对的,而且由于基因突变或者外来物种入侵等原因形成的DNA序列异常片段,很可能会影响系统发生树的构建。基于上述两点问题,本文提出了基于DNA条形码的系统发生树的构建方法。该方法具有以下优点:利用了DNA全序列基因组;不需要进行序列比对;不含参数;减小了基因突变或外来物种入侵对系统发生树的影响;识别速度快。(2)邻接法的改进算法本文对邻接法进行了详细的分析,同时提出了其改进算法。由于邻接法有以下两方面的不足:1).邻接法在更新距离矩阵时,每次都采用不加权的平均距离公式对合并成的新的分类单元和其他分类单元之间的距离进行估计,从而导致邻接法准确性有所欠缺;2).本文中构建系统发生树所利用的距离矩阵是根据第三章提出的基于DNA条形码的系统发生树的构建方法获得的,是不可加的。因此本文提出了邻接法的改进算法,该算法主要是采用引入方差和协方差构建的权值来进行距离估计,使距离估计值更加准确,同时使邻接法的适用范围更加广。(3)系统发生树的实验平台为了构建系统发生树的方便,本文还搭建了一个系统发生树构建的实验平台。该实验平台主要包括邻接法,改进算法,画图程序三部分。