生物多序列比对算法Kalign's的研究分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gm_686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是现代生物信息学中的一个最基本的研究课题。随着生物数据库快速持续的增长,对多序列比对算法的敏感性和运算速度提出了更高的要求,开发具有高敏感性和高效率的算法成为当今研究的重点。本文对此进行了深入研究和探讨,主要研究成果如下: 本文首先介绍了序列比对涉及的基本问题:空位罚分,替换矩阵和比对结果评价标准。接着对基于渐进方法构建的多序列比对算法ClustalW、T-Coffee和Muscle算法进行了深入的研究。然后通过对这些算法的分析,对Kalign算法提出了改进。 Kalign是一种常见的多重序列比对算法,它使用Wu-Manber字符匹配算法来改善比对的质量和速度,对大量序列和距离较远的序列的比对有较明显的速度优势。然而由于对序列的距离估计不准导致比对的质量不高。本文提出了一种改进Kalign比对质量的算法---KaLligns算法,根据Kalign最初比对的结果,利用新的序列距离测试方法计算出新的两两序列之间的距离,然后使用UPGMA方法构建向导树,再进行渐进比对,产生新的比对结果。重复这一过程,直到比对的SP得分不再改变或者达到一定迭代次数为止。用Balibase3.0进行测试,结果显示该算法较好的改进了Kalign的比对质量。
其他文献
知识库是专家系统的核心。由于每个领域的知识都有其自身的特点,并且学科间也存在交叉和重叠,所以知识的共享、重用是非常必要的。基于这些知识很多研究者建立了各自不同的知
医学图像的计算机辅助诊断已经成为人工智能应用领域的研究热点。本文针对人脑CT图像的计算机辅助诊断,提出了一种基于对称性的特征提取方法,完成了图像输入、特征提取、图像
以各类多媒体服务为代表的电信服务需求快速增长,使得厂商之间的竞争愈发激烈。为了在竞争中脱颖而出,各厂商纷纷开始寻求更高效、经济、快速的整体解决方案。对于他们而言面
伴随着计算机的出现和使用,出现了一种新的犯罪形式,这就是计算机犯罪。这种新型的犯罪活动正日益猖獗,给国家的发展和稳定带来了严重的危害,打击和防范计算机犯罪已经成为各
随着互联网的迅猛发展,网络的普及率越来越高,使得网络超越大众媒体成为广大群众获知、抒发自己对各大突发新闻事件、热点新闻事件等的看法、观点、态度的重要的新的渠道平台
计算机网络和信息技术的快速发展,使得我们对网络安全的要求越来越高。主动且动态地对网络进行安全防护的入侵检测是网络安全发展的一个新方向,是传统网络安全技术的必要补充
计算机动画随着计算机图形学和多媒体技术等相关技术的不断发展,已从一个新兴产业不断发展成为一个庞大的产业。群体动画作为计算机动画的一个重要分支,在动漫产业、游戏娱乐、
随着互联网的飞速发展,规模庞大、结构复杂、具有多个属性的网络数据日益堆积。而这些数据的共同特点是“高维性”,如各种电子商务交易数据、Web文本数据、基因表达数据等。传
面向服务架构(SOA)是一种软件体系结构模型,它可以通过网络对松耦合的粗粒度的服务进行分布式部署、组织和使用。Web Services是SOA的一种实现,是自描述的模块化的业务应用程
灌溉农业是我国农业和农村经济发展的基础。大型灌区不仅是我国农业生产和农村经济发展的主力军,而且在整个国民经济和社会发展中都具有举足轻重的战略地位。本文的主要研究