基于三代测序解析油菜和水稻遗传多样性

来源 :华中农业大学 | 被引量 : 1次 | 上传用户:huangqianqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
油菜是世界上第二重要的油料作物,水稻是最主要的粮食作物之一,虽然它们都已获得参考基因组,但是单个参考基因组不能表征作物种内遗传多样性。本研究通过三代测序技术分别构建了八个油菜和两个水稻高质量参考基因组,并以此为基础分析了油菜的亚基因组起源和基因组加倍事件,同时鉴定了油菜种内广泛的遗传变异,构建了油菜种内基因索引和泛基因组,进一步解析了结构变异与多个重要农艺性状的联系,另外也分析了水稻的种内遗传变异和基因家族的扩展,并构建了综合性籼稻生物信息平台。主要研究结果如下:1.八个高质量甘蓝型油菜参考基因组的构建本研究利用Pac Bio、Hi-C、Bio Nano和Illumina测序技术完成了8个甘蓝型油菜基因组组装,其中包括2个春性油菜、2个冬性油菜和4个半冬性油菜,代表了全球范围内主要的油菜亚群。8个从头组装的甘蓝型油菜基因组均达染色体水平,contig N50为2.1-3.1 Mb。核心基因集数据、BAC末端测序数据、Bio Nano图谱、Hi-C数据和RNA-Seq等数据的独立验证结果,都表明了8个参考基因组具有很高的准确性和完整度。基因组注释的结果表明,8个甘蓝型油菜基因组含有94,586-100,919个编码基因,转座元件(TE)序列占全基因组的56.8-58.2%。同时发现C亚基因组长末端重复反转录转座子(LTR-RT)的扩增开始早且持续时间长,导致了C亚基因组比A亚基因组大。甘蓝型油菜的Hi-C图谱具有明显的A/B区室特征,其中B区室集中在着丝粒区域,而A区室主要分布在具有较高基因密度的染色体臂上。2.甘蓝型油菜的种内遗传变异分析和泛基因组构建基于单拷贝直系同源基因构建了十字花科的系统发育树,结果显示相同生态型的品种聚在一起,且人工合成品种与二倍体祖先亲缘关系更近。通过同义替代率分析估算了甘蓝型油菜的基因组加倍和分化事件的发生时间,结果表明甘蓝型油菜形成于约10,000年前白菜和甘蓝的杂交,白菜与甘蓝的分化发生在三百万年前(MYA),芸薹属特有的三倍化事件发生在11 MYA,拟南芥在约14 MYA与芸薹属分化。我们分析了210个甘蓝型油菜品种、199个白菜品种、119个甘蓝品种和前面已组装的8个甘蓝型油菜品种的单核苷酸多态性(SNP)信息,确定了甘蓝型油菜的A亚基因组起源于芜菁,但是C亚基因组的起源仍不明确。通过与中双11(ZS11)基因组比较,在其他7个甘蓝型油菜基因组中鉴定了7.5-15.6 Mb的倒位,39.7-49.1 Mb的易位,77.2-149.6 Mb的存在/缺失变异(PAV)以及大量的SNPs和小的插入/缺失(In Dels),这些变异对超过9.4%的编码基因产生了大效应影响。通过结合8个参考基因组和1,688份油菜品种的重测序数据,我们构建了甘蓝型油菜泛参考基因组,总长约1.8 Gb,包含121,789个编码基因。在基因家族水平上,油菜泛基因组包含105,672个基因家族。在这些基因家族中,约56%是核心基因家族,约42%是非必须基因家族。特异基因家族在“对刺激或胁迫的反应”和“蛋白质磷酸化”等功能上富集。为了方便不同油菜品种之间的基因比较和目标基因的检索,首次构建了甘蓝型油菜的基因索引,包含88,345个编码基因的映射信息。这些数据可以通过甘蓝型油菜泛基因组数据库开放式获取,为油菜遗传改良提供丰富的资源。3.基于PAV-GWAS解析表型差异的遗传基础为了探索结构变异对性状差异的贡献,对角果长、粒重和开花期三个与产量相关的重要性状进行了全基因组关联分析(GWAS)研究。在以ZS11为供体的巢式作图群体中对27,216个PAVs进行了分型。以此为基础,利用基于PAV的全基因组关联分析(PAV-GWAS)确定了导致角果长、粒重和开花期差异的结构变异,表明在鉴定性状关联位点中PAV-GWAS能够作为SNP-GWAS的有力补充。深入分析表明,3个FLOWERING LOCUS C(FLC)基因上的PAVs与甘蓝型油菜的开花期和生态型分化有着密切关系。尤其是Bna A10.FLC基因的结构变异与生态型划分高度相关,这为甘蓝型油菜生态型分化的遗传基础提供了新的见解。4.籼稻参考基因组的构建利用Pac Bio、Bio Nano和Illumina测序技术对籼稻ZS97和MH63进行全基因测序,通过组装获得了高质量的第二版籼稻参考基因组,并分别注释了60,897和60,123个蛋白编码基因。更完整的参考基因组有利于全面解析基因组中重复元件和LTR-RT插入爆发事件,在籼稻基因组中鉴定了约45%的重复序列并观察了它们的分布特征。在ZS97和MH63基因组中鉴定了128万个SNPs,32万个In Dels,以及23.38-24.83 Mb的PAVs。受这些变异影响,ZS97和MH63基因组中分别有6,108个和6,270个non-TE基因被划分为高度差异基因。Chr11染色体末端出现PAVs热点区域,这可能和该区域丰富的抗性基因簇和近期基因重复有关。为了便于水稻研究社区对新一代籼稻参考基因组的使用,本研究中构建了籼稻基因组生物信息平台,并在其中集成了水稻多组学资源和计算工具。
其他文献
稠环芳烃分子因其独特的共轭结构在有机光电、生物光电领域有着非常广阔的应用前景。但是,由于稠环芳烃共轭离域大、分子间相互作用强,使得该类分子溶解性低、稳定性差,严重
发展海上风电是解决气候问题和能源危机,实现我国能源结构升级的重要举措。海上风电建设中,风机基础成本占总投资的30%以上,是决定整个项目经济可行性的关键控制因素之一。对
抑郁症是一种对人们生活乃至生命威胁极大的神经退行性疾病,预计到2020年,其将成为导致人类残疾负担的第二大诱因。虽然目前科学家和临床医生已为抑郁症的治疗付出巨大努力,
随着中国经济进入新常态发展阶段,依靠技术创新实现产业升级是中国经济发展的必由之路。在全球价值链背景下,中国跨国公司在海外开展的一系列直接投资行为,为中国企业利用对
半哈斯勒合金具有优异的电学性能、高的机械性强度、良好的热稳定性,是近年来被广为研究的最有应用前景的高温热电材料。当前P型半哈斯勒合金的最高zT已超过1.5,提升与之相匹
目的:通过观察中药复方扩心方及黄芪多糖对与扩张型心肌病相似表型的Tnnt突变斑马鱼模型的干预作用,和黄芪多糖对异丙肾上腺素诱导的H9C2细胞肥大的作用,探讨扩心方及其有效
自上世纪90年代住房制度改革之后,我国的住房价格水平不断攀升,而城镇居民的基本住房需求也在不断优化。随着住房商品化和私有化进程的推进,住房价格的上涨幅度甚至高于收入
海洋次表层是浮游生物分布和海气能量交换的主要区域,对海洋生态系统、海洋物质循环以及全球气候变化有着非常重要的作用。海洋次表层的光学特性与浮游生物、营养盐和颗粒物
传统网络僵化的体系结构为网络管理和创新研究带来了很大挑战。因此,学术界和产业界提出了许多网络革新方案。美国国防部高级研究计划局1990年提出了主动网络。它的基本思想
研究背景:类风湿性关节炎(rheumatoid arthritis,RA)是一种常见自身免疫性疾病,其病理特征主要表现为关节滑膜炎症、炎性细胞浸润、滑膜成纤维状细胞(RA synovial fibroblast