论文部分内容阅读
十字花科是双子叶植物的一个大家族,包含了模式植物拟南芥及诸多含有遗传学和形态学多样性的物种,具备较高的经济价值和科研价值。丰富的基因组测序数据和经历的多次全基因组多倍化事件使得该类物种成为研究多倍体进化的模型系统。芸薹属是十字花科一个重要的属,包含了白菜、甘蓝、油菜等多种作为蔬菜、调味品及具有重要经济价值的占全世界食用植物油12%生产量的油料作物。作为芸薹属里面重要的一个物种,白菜于2011年完成了测序。在白菜基因序列及后续分析的基础上,芸薹属数据库网站BRAD建成。但随着越来越多的十字花科基因组序列的公布,如何直接有效地利用这些物种基因组信息成了十字花科研究者所关心的问题。本研究通过对13个十字花科物种的共线性分析,获得了12个物种与模式植物拟南芥间的共线性关系。以共线性分析为基础,通过白菜与拟南芥的共线性关系获得了白菜的候选花粉特异基因,并分析了三倍化复制事件对这些候选基因的影响。所构建的十字花科数据库整合了13个物种的基因组的序列等信息和共线性关系,BRAD数据库网站也升级到了2.0版本。主要结果如下:1.共线性关系图清楚地展示了芸薹属物种及亚麻荠的基因组上存在着很多三个共线性片段对应拟南芥一个共线性片段,有力地支持芸薹属物种和亚麻荠经历了最近一次的三倍化复制事件。共线性图提供了从基因组层面观察共线性关系的便利。共线性基因数目的统计,具体展示了十字花科物种与拟南芥在基因组块(GBs)上的及总共的共线性基因数目。这些共线性展示方式可以直观化及具体化十字花科物种与拟南芥的共线性关系。2.十字花科基因组序列等方面的信息经过处理后储存到了十字花科数据库中。以十字花科数据库为基础,BRAD数据库网站也升级到了2.0版本,同时BRAD V2.0除了保留原来功能又添加了新的功能页面去展示十字花科数据库的相关信息。新功能最大特点是实现了共线性关系的可视化,使得研究人员可以直观地查看物种间的共线性关系,并且在此基础上可以更加方便地获取共线性信息。3.三倍化复制事件后,白菜候选花粉特异基因处于进化之中,基因发生了丢失,这可能使得拟南芥与白菜在花粉特异表达基因数目上没有太大差异。另外,白菜候选花粉特异基因中的大部分串联重复基因可能是在三倍化事件之前形成,但在三倍化事件以后发生了丢失,变成了无串联的基因。但也有小部分基因是在三倍化事件之后形成了串联重复基因。串联重复与三倍化复制共同影响了白菜候选花粉特异基因的进化历程。