用生物信息学和系统基因组学作为解决热带树木进化中复杂问题的工具

来源 :广西大学 | 被引量 : 0次 | 上传用户:digitalmachineu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
叶绿体序列由于其高度保守的性质,已被广泛用作系统发育研究的有用工具。使用二代测序方法(NGS)可以容易地从植物中获得完整的叶绿体基因组,为物种划分和系统学提供了宝贵的数据。此外,这些基因组已经广泛用于农业、进化和生态研究、食品检测等,并且目前它们是遗传序列数据库中保存最多的真核基因组,例如日本DNA数据库(国家遗传学研究所)、EMBL(欧洲生物信息学研究所)和基因银行(国家生物技术信息中心)。
  考虑到无论是通过NGS法还是在线平台获取这些遗传资源的高度可行性,如今许多高通量测序方法可用来揭示不同生物基因组的详细特征,从而进一步探索适用不同进化研究的的生物信息学流程。然而,许多用以重建质体序列的测序方法和生物信息学方法的快速发展,可能导致在选择最有效的方法和设置的混乱。对完整质体基因组进行大规模测序的趋势,凸显对标准化和有充分记录的生物信息学工作流的需求。对允许精确基因组序列再现性的高效工作流程的要求尤其明显。此外,大多数已发表的研究仍然没有提供必要的细节来复制他们的生物信息学分析,并且经常仅仅列出所使用的软件工具的名称和版本号。
  另一方面,随着NGS技术提供的基因组资源的快速增加,高效和标准化的元数据管理方法对于生物数据的后处理阶段变得越来越重要。特别是在使用环状叶绿体基因组数据的基于细胞器的研究中,主要结构区域的随机组合(顺序和方向)是对无论大小分类单元形成用于系统发育重建的“现成对齐”数据集的能力的主要限制。此外,在目前的实际操作中,在基因组中可帮助用来对比其他编码区的最多变的区域常被删掉。尽管如此,目前还没有一款软件可以通过对主要的质体区域的检测、组织和定位达到这种程度,这使得固化过程既耗时又容易出错。
  为了解决这两个主要问题,本论文将集中在四个主要章节:第一章介绍叶绿体基因组测序、组装、注释、比对、系统进化树推断中最常用的方法和工作流程,以及对软件选择和精确设置高度敏感的过程。在NGS驱动的基因组研究中,生物信息学工作流程的标准化和可重复性举足轻重。这是由以前几个植物系统发育学研究以及影响下游分析进而影响最终结果的软件工具获得的经验。
  第二章描述利用最新系统发育策略对孔药楠(Sinoporahongkongensis)叶绿体基因组重新组装的实际应用,主要由分子实验、生物信息学工作流程以及质体基因组测序和表征的结果三个部分组成。其中,组装和注释这个质体基因组的生物信息学步骤做详细描述。在组装和注释这个基因组后,将其与樟科和其他科的代表性物种进行比较。在此,我们比对18个物种的所有叶绿体DNA(cpDNA)区域然后进行一个简单的系统进化树推理,作为整个工作流完整性的概念证明。
  第三章介绍一个方便快捷且容易使用的软件---ECuADOR。这个软件基于Perl脚本算法,专门用于自动检测和重组从任何来源(NGS,桑格测序或组装输出)获得的质体序列。ECuADOR使用滑动窗口方法检测原始序列中的长重复序列,然后识别反向重复序列(IRs)(即使在人为或测序错误的情况下),并自动将序列重排为广泛使用的LSC-IRb-SSC-IRa顺序。这有助于快速的后续编辑步骤,例如基因组比对、可变区检测、单核苷酸多态性(SNP)检测和系统发育分析。ECuADOR对被子植物不同科的161个质体测试成功。
  ECuADOR首先为每个数据集鉴别并重新排序中心区域(LSC-IRb-SSC-IRa),然后为叶绿体序列进行新注释。该过程耗时不到20分钟,最大内存需求为150MB,准确率超过99%。ECuADOR是唯一一个从头开始的一步识别和重新排序工具,方便来自NGS数据的核外基因组的后续处理分析。这个程序可在https://github.com/BiodivGenomic/ECuADOR/下载。
  第四章为本研究最重要的结果的总结,强调主要目的、新颖性、发现和未来方向。此研究试图涵盖当今现代系统发育学所面临问题的广阔领域,并总结由于分子和基因组数据的出现,系统发育学领域正在经历的一些最紧迫的挑战。我们强调自动化数据挖掘方法仍然不完整且会随着时间的推移而变化,而这些方法可能会产生错误的数据和结果。这种错误可能会降低系统发育的准确性,并且在缺乏专业知识的情况下无法被发现。
其他文献
民国书坛,大家辈出,辽宁籍史学大家金毓黻先生学识渊博,功力深厚,虽不以书法名世,但其书法成就可谓文人书家之楷模,不容忽视。金毓黻对书法的态度继承了传统文人学书实践的态度,因此对于金毓黻书学思想进行研究极其必要。  对于金毓黻书学思想的研究主要基于其《静晤室日记》中的内容。金毓黻善书,早岁问学于国学家、书法大家白永贞先生。其书以颜真卿楷书入手,后又师法王羲之、李邕、米芾等古代大家,用功颇深,卓然成家
学位
导视设计在平面设计中占据着重要的位置,它的发展也是在现代主义平面设计的影响下推动的。当今社会现状让平面设计发展开始注重民主化,为了满足大众的文化需求,设计开始变得向人性化发展,而这也为导视设计提供了更好的发展空间,使得导视系统的视觉识别功能更加完善。例如在我们的生活中相信很多人都会遇到这样一个情况,当我们到达一座陌生的城市或者一个陌生的场所时都有可能迷失方向,在这个时候,作为人与环境之间的桥梁导视
学位
目的:作为绘画的艺术语言,线条不仅是一种简要的直观表述,也是最基本的重要存在。从古到今,无论是传统还是现代,东方还是西方的美术作品,从各种角度来说,线条都在审美过程中占有很大的比重。从一方面来说,线条便是画作的基础造型,在绘画作品的构成中占有举足轻重的地位;从另一方面来说,线条在作品中绝非孤立存在,它不仅是绘画过稗中的一种手段,同时也承载着后续创作,甚至延伸到了审美意味之上、境界与风格的构成。可以
学位
在教育事业不断发展过程中,素质教育已经成为了目前教育工作的关键,美术教育工作开展也是素质教育理念下的重要构成部分。美术教育不仅仅可以提高学生绘画能力、审美能力、欣赏能力等,其对于学生心理健康发展也有着较为显著的作用。心理健康是指一个人要有正常的智力,良好的行为意识,完整的人格,积极的生活态度,并且有与他人建立良好人际关系的能力表现出符合年龄特征的行为。心理健康是现代人应该具备的基本素质。但现如今学
学位
今天,越来越多的中国本土化卡通形象作为视觉元素被应用在平面设计中。不同种类的平面设计作品都出现了中国本土化卡通形象元素。本文希望通过对中国本土化卡通形象的演变过程以及中国本土化卡通形象在平面设计中的应用范围、应用模式、应用效果以及发展趋势等方面的研究,发现中国本土化卡通形象的视觉特征与文化属性,掌握中国本土化卡通形象在平面设计中的应用规律。  首先通过研究中国本土化卡通形象从早期探索时期到现代商业
学位
我国开始研究城市形象这一课题起步时间相对欧洲晚了很多,从1960年以后才有专业的学习研究,城市形象这一学科涵盖内容广泛,包含了城市的规划、色彩、心理、景观设计学等各色学科,城市形象是以城市托举色彩,通过色彩的表现塑造城市的形象,从而加快城市的发展。  本论文立足于国内外对于城市色彩的研究成果基础上,针对国内对于每座城市不同色彩特点研究不足的现状,进行全面深入的研究城市建筑色彩这一课题,并以沈阳市为
学位
儿童游乐场所是儿童进行游戏的主要场所,游戏对儿童的身心、智力的发展都具有重要的意义。二胎政策的放开,儿童越来越被重视和关注;而城市化进程使得城市的绿地面积逐渐减少,加上环境的污染和季节天气的限制,儿童的游戏活动大多都在室内游乐场所进行。目前,我国的室内儿童游乐场所的建设存在诸多的问题和不足,比如游戏空间的缺乏、游乐设施单一、空间布局不合理、缺乏趣味性和创造性等等。因此,为儿童创建高品质的室内儿童游
语言是人类社会文明的产物,是人类最重要的思维认识工具和交际工具。游戏和说话是幼儿期儿童生活的要素,是训练其语言发展的重要因素。有教育学家认为4-12岁是人的语言发展的关键期。而学龄前期这一阶段为其提供良好的语言教育条件,在一定程度上能促进儿童语言未来的发展。这一时期所进行的教学形式非常丰富,已有诸多学者进行研究。而利用这一时期的美术学科的优势来提升语言表达能力,目前还缺乏系统性的研究。  通过游戏
学位
野生二粒小麦(TriticumdicoccoidesL.,2n=4x=28,AABB),是普通小麦(TriticumaestivumL.,2n=6x=42,AABBDD)A、B染色体组的供体种,是普通小麦改良的优质基因资源。为了更好地利用野生二粒小麦的基因资源,本研究探讨了野生二粒小麦种内的遗传分化情况,以及A、B基因组的进化速率,并通过选择信号检测发现了两个在野生二粒小麦驯化过程中受到显著选择的
链霉菌不仅可以产生丰富的次级代谢产物,同时还产生大量的酶。作为革兰氏阳性菌,链霉菌拥有强大的分泌系统,具有作为原核蛋白分泌表达宿主的优势。本研究选用来自委内瑞拉链霉菌中的枯草蛋白酶抑制剂SSI基因的分泌信号序列VSI,将其融合到目标蛋白的N端,利用两种组成型强启动子Pvsi和PaziA4分别构建出链霉菌分泌型表达载体pJZ008和pJZ009。利用荧光显微镜、SDS-PAGE和Westernblo
学位