论文部分内容阅读
陆地棉为世界纺织业提供了最多的天然纤维,是我国最重要的经济作物之一。生育期、株型、产量和纤维品质等是陆地棉重要的农艺性状,关乎到棉花的经济价值和生产方式。这些性状为复杂的数量性状,受到微效多基因的控制,通过传统的育种方法很难改良。解析这些性状的遗传基础对实现高效的陆地棉分子育种具有重要意义。关联分析作为近年来发展起来的一种检测QTL的高效手段,被得到广泛应用。本研究主要基于两个群体关联分析解析陆地棉生育期、株型、产量和纤维品质性状的遗传基础。1基于503份种质资源全基因组关联分析解析陆地棉重要农艺性状的遗传基础本研究广泛收集了中国国内的503份陆地棉种质资源,这些种质资源主要包括国内的5个主要棉区的栽培品种以及美国和前苏联引进的品种。利用CottonSNP63K芯片以及一张已发表的基于该芯片构建的高密度遗传图谱对503份材料进行基因分型,筛选获得了11975个高质量的多态性SNP。群体的多态性系数和遗传多样性系数均值分别为0.332和0.391。通过估算群体的连锁不平衡水平,发现LD衰减距离为6.1cM(r~2=0.1)。经过STRUCTURE模拟、PCA分析和绘制N-J进化树,将503种质资源划分成了3个明显的亚群。考察获取了503份种质材料8个环境共16个重要农艺性状的表型值。利用11975个SNP标记和BLUP后的表型值,选择能够很好地控制假阳性的混合线性模型MLM(Q+K)进行全基因组关联分析。16性状共检测到324个显著关联的SNPs,解释率范围为3.17%-9.04%。参考LD衰减距离将324个显著关联到的SNPs划分为160个QTLs,其中有7个QTLs在最近的研究中被报道。有28个QTL区间和11个处于连锁的QTLs与多个性状关联,表现出位点或基因的多效性,通过绘制QTL网络图展示了性状与QTL之间的网络联系。此外,参考基因组织表达信息和已报道基因的功能,分别筛选出了336和18个可能的候选基因。在一个LD衰减较快的位点上,鉴定到了一个可能跟LP相关的候选基因(Gh_D08G2376)。2基于8亲本MAGIC群体的关联分析解析陆地棉重要性状的遗传基础构建了一个8亲本的陆地棉MAGIC群体,群体大小为960个株系(MLs)。MAGIC群体及亲本在2013-2015年共进行了5个环境的表型实验,考察了14个重要农艺性状。性状的的遗传力在PMs和MLs中的变化范围分别为0.11-0.87和0.17-0.85。比较表型的变异范围,发现单环境和BLUP的表型值中,MLs的变异范围都高于PMs,说明MLs比PMs的表型变异更丰富。在研究前期,利用PMs从本实验室发表的高密度的陆地棉-海岛棉遗传图谱上筛选获得284个高质量且多态性好的SSR标记。基于284个SSR标记对MLs进行基因分型。SSR标记遗传多样性系数在PMs和MLs中的平均表现为0.415和0.463,MLs的遗传变异比亲本丰富。此外,通过PCA分析发现MAGIC群体没有明显的群体结构。估算MAGIC群体的LD水平,衰减距离为0.76cM(r~2=0.1)。利用忽略群体结构干扰的混合线性模型MLM(K)将14个性状BLUP的值与SSR标记关联,在p<0.01水平上检测到139个显著关联的SSR标记。显著位点的解释率范围为0.71%-7.23%。139个位点覆盖了96个SSR标记,有40个标记在前人的研究中被报道,6个被报道的结果与本研究结果一致。另外有26个SSR标记同时关联到多个性状,表现出位点多效性。此外,我们发现了9个热点位点,这对后续的遗传研究和指导育种具有非常重要的价值。为了深度对MAGIC群体进行基因分型,基于表型和219对SSR标记挑选出了一个较小的MAGIC群体(SMLs),群体包含372株系。在2016年增加了一个地点的SMLs的表型试验。利用SLAF-seq技术对PMs和SMLs进行基因分型获得60495个SNPs。估算SMLs的连锁不平衡水平,当r~2衰减到0.1时,LD衰减距离为600kb。利用SNP基因分型数据和SMLs的表型数据进行全基因组关联分析。14个性状6个单环境和BLUP的表型数据共检测到975个显著关联的SNP,覆盖400个QTLs,对表型变异的解释率范围为5.08%-53.80%,平均值为11.01%。其中有30个QTLs在多个环境中被检测到,另外有88个QTL区表现出位点多效性。参考组织表达模式数据库,在144QTL区间内筛选到了271个相关组织特异表达的基因,此外鉴定到18个功能已知的基因位于相关性状的QTL区间内,这些基因可以作为候选基因。