基于图形表示的DNA序列相似性分析

来源 :河北科技大学 | 被引量 : 4次 | 上传用户:alabo353
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成和模式生物基因组计划的全面实施,产生了大量的生物数据。生物学研究的重心由数据的采集积累向数据的解读分析过渡。生物信息学就是在这样的大背景下应运而生,其主要的研究内容是科学的处理分析生物数据,从中提取其所包含的生物信息。生物信息学是一门交叉学科,综合运用数学、生物学、计算机科学、信息科学等诸多学科的知识和方法来挖掘和提取生物序列所包含的生物规律。对生物序列设计有效的图形表示并进行相似性分析是目前生物信息学一个比较热门的课题。  本文主要开发新的DNA序列的图形表示方法,基于图形表示对DNA序列作相似性分析。本文主要工作如下:  1)提出了一种新的有效的2维DNA图表示方法——B曲线,详细阐述了图表示的具体构建过程,然后从图形中提取特征组成24维的特征向量来代表DNA序列,利用向量的欧氏距离来表示序列的相似程度。  2)为了验证B曲线方法在生物序列分析中的有效性,我们基于图表示B曲线,对11个不同物种β球蛋白基因的第一个外显子序列进行研究,构造了相似性矩阵,并构建了系统发育树,对上述序列作了相似性分析,得到的结果也比较理想,说明了该方法的有效性。为了进一步验证,我们将该方法应用到45个物种的线粒体基因序列,结果基本符合生物进化关系。  3)将二维图形表示方法B曲线应用到两个甲型流感病毒数据集,进行了相似性分析,并与其它6种算法进行了比较,结果也比较理想,说明了该方法的实用性和优越性。
其他文献
学位
本文研究由二维裂缝引起的散射波场的计算问题,在裂缝的两侧介质具有不同的声学特性,该问题可以由Helmholtz方程的一类边值问题来描述. 本文在裂缝的一般参数表示下给出了该
本硕士论文由四章组成,主要讨论几类非线性常微分方程组多点边值问题解的存在性。第二章研究了一类二阶常微分方程组多点边值问题多个正解的存在性。第三章讨论了偶数阶三点边
此文包括如下两个章节: 第一章:预备知识。本章介绍本文中要用到的一些基本概念和性质,共分三个部分: 第一部分主要对布朗运动的起源和发展过程作一个简单的回顾,然后介绍布
本文研究了若干类LA-群和一类特殊P-群自同构群的结构。利用自由群的方法,即用生成元及定义关系和扩张理论推导了若干LA-群的新系列,用群的扩张理论及自由群的方法证明了满足这
随着人民币汇率形成机制的不断完善,人民币汇率的波动幅度开始增大,汇率风险也不断增大。为了有效规避人民币的升值或贬值风险,人民币衍生产品的发展也越来越迅速。   从计算