论文部分内容阅读
基因组遗传变异是研究动物表型差异的重要基础。拷贝数变异(copy number variation,CNV)作为一种重要的遗传变异,可以影响机体多种复杂性状和疾病,其在畜禽上的研究逐渐成为热点和重点。目前,全基因组CNV检测的方法主要有SNP芯片、CGH芯片(array comparative genomic hybridization,aCGH)和高通量测序等。然而,在牛与山羊中,系统地进行全基因组CNV检测、群体间多样性分析及其与表型性状的关联分析等研究,仍十分匮乏。本研究首先分别采用牛CGH芯片和山羊SNP芯片对47头美国荷斯坦公牛和1023头世界范围内的山羊检测了全基因组CNV的分布;然后,利用全基因组关联分析(genome-wide association studies,GWAS)策略挖掘与美国荷斯坦公牛和非洲肉用山羊表型相关的CNV;最后,选择肉奶生产性状相关的3个功能基因区域的CNV,分别探索其在中国牛或山羊中对基因表达和表型的遗传效应。本研究主要取得了如下结果:1.美国荷斯坦公牛拷贝数变异的检测利用CGH芯片技术对47头美国荷斯坦公牛进行了全基因组CNV检测,发现1758个CNV区域(copy number variation regions,CNVRs),通过对不同个体CNVR的合并,共确定1043个CNVRs,共覆盖46,802,944 bp,约占普通牛(Bos Taurus)基因组序列的2.06%。在这些CNVR中,包含702个拷贝数缺失类型(Loss)、270个拷贝数增加类型(Gain)和71个拷贝数增加和缺失的混合类型(Both)。Loss型的总长度分别约为Gain型和Both型的2.5倍和3倍。在29条常染色体中,7号和12号染色体上的CNV数目最多;17号和27号染色体的CNV平均长度明显长于其他染色体。与以前利用SNP和NGS技术所得的荷斯坦牛CNV结果相比较,本研究中的22.13%(216/976)与以前研究重叠,基因组15,866,448 bp的CNVR得到了验证。与牛数量性状位点(quantitative trait locus,QTL)进行重叠分析,91个CNVRs与QTL重叠。对CNVRs功能注释,发现其包含761个基因,Gene Ontology(GO)分析显示这些基因主要富集在与染色体组装、嗅觉刺激、应激和感知等相关的生物过程。2.美国荷斯坦公牛拷贝数变异与复杂性状的全基因组关联分析利用CNVtools进行了297个CNVRs与美国荷斯坦牛41个复杂性状的GWAS,结果发现87个CNVRs与表型显著相关,39个CNVRs与至少2个表型显著相关。值得注意的是,24个CNVRs与女儿怀孕率(daughter pregnancy rate,DPR)相关。将41个性状分为四大类,分别统计显著关联的CNVR,结果显示:1)35个CNVRs与8个繁殖性状相关;2)21个CNVRs与7个健康性状相关;3)25个CNVRs与6个生产性状显著相关;4)39个CNVRs与15个体型性状显著相关。其中,35个CNVRs与47个蛋白编码基因的编码区和(或)侧翼序列重叠。分析与CNVR重叠的功能基因在91个牛组织或细胞类型中的表达谱,提示与复杂性状显著相关的CNVRs可能通过影响其重叠的功能基因发挥作用。比如CNVR661、CNVR213、CNVR758对表型的显著影响可能分别与重叠基因CYP4A11、CTR9、CAPZA3的功能有关。3.世界山羊拷贝数变异的检测及多样性分析利用ADAPTmap项目基于山羊52K芯片产生的分型数据,本研究利用PennCNV软件检测了50个品种共1023头山羊的CNVs,发现了6286个CNVs。将这些CNVs合并,得到978个CNVRs,覆盖全基因组约292Mb,占山羊基因组约8.96%。其中,526个CNVRs至少包含2个CNV事件,累积长度约为191 Mb,占山羊基因组的6.53%。为构建不同群体间CNV图谱,将所有个体分为6个亚群,包括Western Asia(WAS)、Eastern Mediterranean(EME)、Alpine&Northern Europe(ANE)、Madagascar(MAD)、Northwestern Africa(NWA)和Southeastern Africa(SEA)。对CNV发生的频率而言,NWA亚群最高,ANE亚群最低;在29条常染色体中,1、5、6、12、14、17号染色体较高,21、22、28号染色体较低。对群体间的CNV分布差异而言,5、6、14、17、20号染色体较大。根据各CNVR在6个山羊亚群间的变异系数揭示CNV分布多样性,发现一些组间存在明显差异的CNVRS,如分别位于17、13、3、14号染色体的CNVR1、CNVR4、CNVR8、CNVR9。基于变异系数前5%的CNVRs在各组中的CNV频率,进行6个亚群的聚类分析。结果显示,非洲3个亚群中,SEA和MAD聚在一起;欧洲2个亚群中,ANE和WAS距离更近,而后与EME聚在一起。功能注释结果显示,526个至少包含2个CNV事件的CNVRs与1437个基因重叠。其中,有154个基因位于群体间差异大的CNVRs(Variance>0.01)。GO分析结果显示,CNVR重叠的基因主要富集在结合、代谢和细胞膜组成等通路上。在CNVR重叠的基因中,鉴定了一些重要功能基因(如EDNRA、ADAMTS20、ASIP、KDM5B、ADAM8、SHH、DGAT1),这些基因与山羊的适应性进化,如毛色、肌肉生长、脂肪生成和泌乳性能等有关。4.非洲肉用山羊拷贝数变异与体尺性状的全基因组关联分析利用Golden Helix SNP&Variation Suite(SVS)软件检测了来自4个非洲肉用山羊品种126头个体的CNV。筛选过滤后共鉴定30个长度范围为30,237 bp~4,910,757bp的CNVs。利用线性回归模型分析了这些CNVs与6个体尺性状的关联性。结果发现CNV4与胸宽、CNV27与胸宽和胫骨宽显著相关。功能注释发现CNV4和CNV27分别与ADCY1和SNX29基因重叠。多项研究显示,SNX29基因的SNPs与家畜的肉用性状显著相关。而且,CNV27位于SNX29基因两种预测转录本的差异序列区域。因此,推测CNV27可能通过影响SNX29基因的功能,从而对肉用山羊的生长发育产生剂量效应。5.中国牛羊中3个经济性状相关基因拷贝数变异的遗传效应分析比较山羊和牛全基因组CNV检测结果,发现共33个基因在牛与山羊均存在CNV。为探究CNV对基因表达和表型的遗传效应,本章选择3个与肉奶生产性状相关的功能基因(SHH、MAPK10和DGAT1)的CNVs展开研究。其中,牛SHH CNV位于基因编码区,牛MAPK10 CNV位于基因内含子区,山羊DGAT1 CNV包含整个基因区。对CNV的分布而言,牛SHH CNV、MAPK10 CNV和山羊DGAT1 CNV在中国牛群和羊群中的分布差异显著。研究CNV与牛和山羊的表型的关联性发现:1)SHH CNV与3个黄牛品种的生长性状相关。秦川牛的胸深、南阳牛18月龄的体重、体长、胸深在SHH CNV Gain类型(拷贝数>2)的个体中显著更优。晋南牛的胸围和体重则在Normal型(拷贝数=2)个体中更优。2)MAPK10 CNV与南阳牛初生重、18月龄体高、30月龄的体重和日增重显著相关,并且,均表现为Normal型个体的性状显著优于其他两种拷贝数变异类型(P<0.05或0.01)。3)DGAT1 CNV与关中奶山羊的髋骨指数相关,1拷贝比0拷贝个体的髋骨指数更高。萨能奶山羊中,DGAT1 CNV与晚间泌乳的FPD和SNF有关,且Loss类型(0和1拷贝)显著高于正常型。由此可见,牛SHH CNV和MAPK10 CNV与羊DGAT1 CNV分别可作为改良肉牛产肉性状与奶山羊泌乳性状的重要分子标记。研究CNV对基因表达的剂量效应发现:1)SHH CNV与成年秦川牛的脂肪组织中SHH基因的表达量显著负相关;2)在胎牛时期,MAPK10 CNV与肌肉和脑中MAPK10及肌肉分化标志性基因MYOG显著负相关;在成年牛时期,与脂肪中MAPK10和抑制脂肪分化的FOXC2有弱负相关趋势。但是,与促进脂肪分化的FABP4则呈正相关。这些结果提示,SHH CNV和MAPK10 CNV的拷贝数增加可抑制肌肉或脂肪中基因的表达,从而对黄牛生长性状产生剂量效应。