基于模拟退火算法的两物种小系统发育问题算法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:majk509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分子生物学和高通量基因测序技术的飞速发展,大量的DNA序列数据已被测定,这为研究基因家族分子进化提供了必要的前提条件。根据现有生物基因重建基因家族进化史可以推断出一个可靠的系统发生,这对揭示有关基因家族进化过程具有重要意义。重建基因家族进化史不仅有助于我们更好的研究生物进化的进化机制和历史,而且还可以帮助我们揭示显性的基因组学基础、研究基因的功能。近年来,重建基因家族进化史受到国内外众多学者的关注和研究,已经成为了比较基因组学中一个重要的研究方向。本文主要针对两物种小系统发育问题进行研究,并基于模拟退火算法提出求解该问题的SA2SP算法和multiSA2SP算法。具体工作如下:针对复制-丢失比对问题模型,对两物种小系统发育问题的算法进行研究,并提出解决该问题的模拟退火算法SA2SP。首先,算法SA2SP包含比对算法ALING,该算法通过对给定的两条基因序列有针对性的插入一定数量的字符‘-’,以获得使两条基因序列上基因最大匹配的一个序列比对。其次,对于给定的一个序列比对,算法SA2SP包括一种标记算法LABLE,该算法利用复制-丢失操作序列标记给定的序列比对,其最终问题解为对应标记代价最小的比对基因组。算法SA2SP利用ALIGN算法产生问题初始解,利用LABLE算法来衡量解的优劣,并在保持邻域解多样性的前提下,引入基因块智能移动、相邻基因块位置互换和重新匹配基因块3种智能邻域算子,以产生当前解较好的邻域解,提高算法寻找问题最优解的能力。通过对算法SA2SP与算法PBLP用4种菌属的真实RNA基因数据对进化代价与时间性能测试,实验结果表明,算法SA2SP能够获得较PBLP算法更小的进化代价,且其运行时间在实际应用中是可行的,是求解两物种小系统发育问题的一种有效方法。进一步,对仅考虑复制、丢失操作的复制-丢失比对问题模型进行研究,新添加倒位(Inversion)操作,提出复制-丢失-倒位比对问题模型,并提出求解该模型下两物种小系统发育问题的求解算法multiSA2SP。首先,提出基于动态规划求解最长公共子串问题的比对算法multiALING,通过在两条基因序列中不匹配位置插入字符‘-’,以得到两条基因序列的一个序列比对。其次,对于给定的一个序列比对,本文提出一种标记算法multiLABLE,该算法利用复制-丢失-倒位操作序列标记给定的序列比对,并获得对应标记进化代价较小的操作序列。论文基于提出的multiALING算法和multiLABLE算法,设计了一种求解复制-丢失-倒位演化模型下两物种小系统发育问题的模拟退火算法multiSA2SP。算法multiSA2SP通过multiALIGN产生初始解,利用multiLABLE来衡量产生邻域解的优劣,根据邻域解进化代价作为是否替换当前解为新解的重要依据。同时还引入基因块智能移动、相邻基因块位置互换、重新匹配基因块和倒位基因块智能组合4种智能邻域算子,以产生当前解较好的邻域解,提高算法寻找问题最优解的能力。算法multiSA2SP在仅考虑复制、丢失操作的前提下,利用4种真实菌属的RNA基因数据对算法进化代价和运行时间性能进行测试,实验结果表明,算法multiSA2SP在仅考虑考虑复制、丢失操作的情况下,能够获得较PBLP算法更小的进化代价,是求解复制-丢失-倒位模型下两物种小系统发育问题的一种有效方法。综上所述,针对两物种小系统发育问题,本文提出了求解复制-丢失比对问题模型下该问题的模拟退火算法SA2SP,并获得了较好的优化效果。此外,本文对复制-丢失比对问题模型进行扩展,不仅提出了复制-丢失-倒位比对问题模型,而且还提出了求解该问题的模拟退火算法multiSA2SP,同样获得了较好的优化效果。由此可见,本文为解决小系统发育问题提供了两种较优的求解方法。
其他文献
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的
随着分布式计算技术的发展,Web服务已逐渐成为构造分布式计算平台的标准和现代企业的服务框架,其动态性、平台无关性、开放性以及松散耦合性等特点为信息系统之间的相互协作
迁移工作流是近年来工作流管理的一个新的研究方向。它将移动计算技术引入到传统工作流系统上,把工作流系统分为工作流引擎、工作位置和迁移实例三部分。迁移工作流很好的解
随着实际需求的变化,曲线的绘制方式不断的涌现,如参数三次曲线、B(?)zier曲线、B样条曲线、NURBS曲线。其中B样条曲线及其特例三次均匀B样条曲线在很多领域都得到了应用。B
光照问题是人脸识别面临的主要难题之一,由于光照变化改变图像灰度空间的分布,当使用灰度信息特征去识别人脸时,往往会使类内差异(同一个人的不同人脸图像)大于类间差异(不同
随着城市轨道的快速发展,行车安全受到越来越多的关注。在列车运行过程中,司机在长期集中注意力的情况下难免会有疏忽,借助计算机辅助列车安全运行已成为主流的研究方向。目
近年来人工智能渐渐成为改善和提高游戏质量的热门研究课题之一,在游戏设计中开发者越来越重视虚拟角色的智能行为。在游戏开发中,人工智能是一个既重要而又复杂的模块,虚拟
如今,随着商务化程度的不断提高,全世界商务机构的决策者们需要不断寻求新的方法来了解和提高他们的业务和产业。过去的历史告诉我们,知识需要去粗取精、不断的更新。几个世纪以
互联网的普及使人们的社交模式发生了深刻变化,便利的平台也为人们的社交提供了巨大的方便。随着用户数量日益增加,网络数据量也越来越大,成为了当前互联网中的一种重要资源,
XML正迅速取代HTML成为Web上数据表示、集成和交换的标准,与HTML相比,XML格式简单,自我描述能力强,实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近年来XML在许多领
学位