论文部分内容阅读
茶树是重要的经济作物,其基因组大,杂合度高,物种高度分化。已发表的舒茶早和云抗10号基因组都没有达到染色体级别,scaffold N50小于1.4 Mb,连续性不高的基因组不利于位于基因间区的变异检测和基因组进化研究。舒茶早和云抗10号基因组注释基因核心蛋白评估结果质量不高,得分分别只有80.58%和68.58%,不完整的注释基因妨碍茶树群体驯化选择研究、功能基因组研究和分子育种研究。茶树分类缺少综合的基因组学证据,全基因组测序能为茶树分类提供新的更全面的证据。本研究利用龙井43组装了一个高质量的染色体级别的基因组并从全世界收集到了139个茶树样品,并进行了群体重测序,展示了栽培茶树的驯化历史,揭示了茶树群体的系统发生关系。本研究为茶树基因组学研究和分子标记育种提供了新的资源,并且给茶树将来的遗传和进化研究带来了更多的机遇。本研究主要结果如下:1.高质量茶树基因组组装:使用WTDBG利用三代PacBio序列组装出3.26 Gb龙井43基因组。进一步利用Hi-C技术组装出染色体级别基因组,scaffold N50为143.85 Mb。龙井43基因组在单碱基水平和scaffold水平准确性都较高,基因组具有较好的连续性。龙井43注释得到33556个基因,是目前茶树基因组中BUSCO评估完整性最高的基因集。2.目前最全面的茶树群体重测序:本研究从全世界收集到139份茶树样品,是目前为止最全面的茶树重测序研究。通过群体重测序,提供了全基因组水平上的系统发生树揭示了茶树群体的系统发生关系,展示了栽培茶树的进化历史。本研究为茶树组学研究和分子育种提供了新的高质量的全基因组测序资源。3.茶树起源:本研究数据显示茶树近源种群体是中国小叶种茶树和中国大叶种茶树的祖先,关于茶树起源和驯化充满争议,本研究拉开了茶树起源和驯化的序幕,将来更多茶树近源种的测序会有助于揭示茶树的起源和驯化问题。4.茶树驯化:本研究揭示了中国大叶种茶树和中国小叶种茶树选择方向差异,中国小叶种在驯化过程中与风味相关的萜烯类代谢基因和抗病相关基因受到选择强于中国大叶种茶树。