论文部分内容阅读
本文分析了基因岛的特征和基因岛预测的相关方法。通过序列构成方法和比较基因组方法的比较,提出了利用k-mer频率进行基因组异常片段的识别方法,利用与噬菌体相关的特征基因对异常片段进行筛选相结合的方法对基因岛进行预测。针对比较基因组方法存在的假阴性问题,序列构成方法的假阳性问题,和基因岛中存在的多种特征基因,提出了利用k-mer频率方法,比较基因组方法与特征基因筛选方法相结合的混合方法进行基因岛的预测。通过对酿脓链球菌相关基因组进行实验测试和与其他基因岛预测算法得到的基因岛的比较,分析了算法的预测效果。实验结果表明,我们提出的方法可以非常有效地预测基因岛。隔离迁移模型(Isolation with Migration model)是根据分子数据利用系统发育推断进行群体遗传学中群体分化研究的模型。通过分析隔离迁移模型的原理和系统发育推断过程中所利用的算法,针对隔离迁移模型时间复杂性和空间复杂性的问题,通过对隔离迁移模型在系统发育推断过程中计算方法的分析,找到了算法的可扩展之处。在此基础之上,通过利用高性能计算的方式对隔离迁移模型进行并行化处理,提出了隔离迁移模型的链并行模式和数据并行模式,并通过实验分析了隔离迁移模型并行化的效果。隔离迁移模型的链并行和数据并行模式都达到了近似线性的加速比。