论文部分内容阅读
INDEL是植物基因组中一类序列和长度多态性的变异类型,兼备了简单重复序列(SSRs)和单核苷酸多态性(SNPs)变异的特征,因此该类型变异可以被开发成遗传学研究和作物育种中理想的分子标记。目前,在甘蓝型油菜中,还没有报道大规模的INDEL变异被报道。本研究中,我们对来自不同生态地区且拥有不同生长习性的23个甘蓝型油菜自交系进行基因组重测序,共获得了351.2Gb数据;随后,将这些短序列比对到甘蓝型油菜参考基因组(AC)以及祖先种参考基因组(A+C),鉴定到了大量的INDEL变异位点。以AC和A+C参考基因组分别分析得到的测序深度平均为12.4和9.4倍。23个甘蓝型油菜自交系以AC和A+C参考基因组分析得到的成功比对率分别为61.1%-89.1%和46%-66.9%。 本研究中共鉴定到538,691个序列长度为1-10bp的INDEL变异位点,其中104,190个被特异地定位到参考基因组的各个染色体上。在这些被定位的INDEL变异位点中,135,596(25.17%)个位于注释的基因中。单个碱基长度的INDEL变异位点数目(63.6%)显著得多余其它序列长度的变异位点数目。核苷酸A和T单碱基以及包含AT的INDEL变异位点数目超过了总数的65%。分析结果表明,甘蓝型油菜基因组中INDELs变异位点的平均密度为0.63/Kb。其中,A基因组包含了311,927个INDELs,平均密度为0.99/kb;C基因组包含了224,752个INDELs,平均密度为0.43/kb。与A基因组相比,C基因组在转座子区域的具有较高的INDEL变异位点。总之,每个染色体上的INDEL数目基本上与染色体的长度成正比;但是,在C02,C05,C06,C08和C09等5个染色体上的INDEL数目显著低于整个基因组的平均值。INDEL数目热点分析结果表明局部染色体的INDEL数目达到了整个基因组平均值的16.15倍,A和C基因组中分别鉴定到38和335个热点区域。与A基因组相比,C基因组中具有较少的INDEL数目和较多的热点区域,这个结果表明C基因组的INDEL分布不均匀。 利用23个ILs实验验证了595个序列长度为2-5bp的INDEL位点。530(89.01%)个标记扩增出单个扩增子,可以被认为是单位点INDEL标记;其中,523(87.9%) INDEL标记在23个ILs中表现出多态性。随后,利用188个重组自交系构建了一张包含108个单位点INDEL标记和和89个锚定SSR标记的遗传连锁图谱。该图谱包含了甘蓝型油菜的19个连锁群,总长度为1356.9 cM。19个连锁群上的INDEL标记分布是不均匀的,C03染色体上的标记数目最多(22),其次是A08(8)和C04(8);C08染色体上的标记数目最少(1)。大部分被定位到遗传图谱上的INDEL标记顺序和其在甘蓝型油菜‘Darmor-bzh’参考基因组上的物理顺序是一致的。本研究中鉴定到的INDEL变异位点和新开发的INDEL标记为甘蓝型油菜遗传学研究和分子育种提供了有价值的资源。