基于公共路径的DNA多序列比对算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:alexander_guwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是生物信息研究的基础和前提。进行序列比对的目的之一是让人们能够判断序列之间是否具有足够的相似性,判定序列之间是否具有同源性,进而为蛋白质结构和功能预测、系统进化树的建立、基因病的治疗、新药物设计等许多生物研究提供了宝贵的信息。序列比对算法的研究已经成为生物信息学中的热点研究课题,特别是多序列比对。现在大多数序列比对软件以动态规划算法作为其空位插入的核心算法。然而,一个普遍的问题是目前常用的大部分序列比对算法虽比对结果越来越优,但却均由于计算复杂度所导致的计算速度缓慢这一瓶颈而在应用上受到限制。虽然近年来由于算法自身的不断改进以及计算机科学的发展,从而使现在应用广泛的序列比对程序如CLUSTALX获得了相对满意的计算效率,随着各种基因组测序计划陆续完成,大量序列数据急剧增长,以序列比对为核心的数据分析任务对于高效率的多序列比对算法的需求日益迫切。本文是在MICHSEL S. WATERMAN提出的基于欧拉路径的DNA多序列比对算法的基础上,通过对该算法的分析,找出该算法中存在的一些问题,对该算法作了进一步的探索,并通过程序实现来进一步检验该算法的运行速度及比对结果得分函数的高低。该算法是一种新颖的算法思想,运行速度快,比对结果好。这种算法与渐进算法中的CLUSTALX的最大不同是把导入的DNA序列片段构建成一个有向图,然后按照图形的一定转换规则,得到我们需要的一个有向无循环图,从图中根据边的多样性得到一条公共序列,通过这个公共序列与所有输入的序列进行两两比对,最终求得多序列比对结果。本文从程序实现的角度对该算法进行了研究,对该算法一些地方进行了改进,通过不同的得分函数对比对结果的计算,可以看出我们的比对结果有一定的改进,并与不同的多序列比对算法进行了比较。
其他文献
随着图像科学各基本理论的进展,数字图像处理技术在国民经济各部门得到广泛的应用。数字图像处理技术作为计算机科学的一个重要研究领域正在受到广泛的重视,数字图像处理技术已
随着Web服务技术的发展,Web服务相关标准的完善,支持Web服务的平台的成熟,网络中可以实际应用的Web服务越来越多,基于Web服务的应用技术成为当前电子商务的一个主流技术。然而,现
本文主要围绕着开放源码的入侵检测系统Snort中模式匹配算法展开的一系列的工作。 首先,从Snort系统入手,分析此系统工作的原理,介绍特征分析和协议分析。重点对系统中规则的
论文以数字化图书发展过程中面临的困难——异构电子数据资源给读者的使用带来不便为背景,介绍了目前为了实现电子资源的“一站式”查询,而在电子资源系统集成时所采取的通用解
近年来,传统优化方法在解决复杂实际工程最优化问题时的弊端日益暴露,已无法适应多极值、难建模、多约束的问题需求,群智能优化算法在此背景下提出并因其优点得到快速发展。P
随着城市的快速发展,城市化进程中的安全问题也引起社会的重视,尤其是在智能安防、城市交通、公共安全领域,行人安全越来越重要。因此行人检测成为研究领域的一个热门研究方
在充分研究对外加工贸易企业特点、需求,海关监管的各种工作流程和业务标准,以及对现有物料管理系统进行分析的基础之上,结合目前比较流行的J2EE技术,提出了一种基于J2EE的对
客户关系管理CRM是近年来新兴起的理论,它的实施帮助企业增强了自身的竞争实力。在CRM中,数据挖掘理论有着广泛的应用。本文就是将数据挖掘中的序列模式理论应用到CRM的客户分
出租车作为城市公共交通的重要组成部分,一定程度上满足了公众定制化出行需求。但是,定制出行需求的微观随机性和宏观规律性并存,有限的出租车资源和出行需求的时空分布给车
在Internet上充斥着海量的信息,这些信息一方面为人们的生活提供了方便和帮助,另一方面也使得人们淹没在信息的海洋中而无所适从,无法有效地获取有用的信息。为了解决这些问题,数