论文部分内容阅读
目的:不当的使用酒精是影响全球公众健康的一个主要的危险因素。长期使用酒精,可导致高血压、癫痫、消化道癌症、暴力倾向和自杀倾向。酒精依赖则是导致人们长期酗酒的主要原因。酒精依赖是一种慢性且容易复发的复杂性状,具有高度可遗传性。由于人们对酒精的渴望受到不同维度的影响,这使得临床上对该性状的治疗增加了许多困难。为减少酒精的不当使用给使用者自身、家庭以及社会带来的危害,科学家们从遗传的角度研究了酒精依赖基因的比重。经典的双生子研究在证明酒精依赖具有高度遗传性的同时,发现遗传度估计值往往受到环境因素的影响。而近几年的全基因组关联性分析,从基因的角度找到许多酒精依赖相关的显著位点,但是这些位点的效应只能解释遗传度的一小部分。本文应用GREML模型,在考虑所有变异位点的基础上,更加准确的估计了酒精依赖的遗传度及不同SNPs分组对遗传度的贡献,为进一步探查该性状的因果变异和基因结构提供了研究基础。方法:本研究使用的基因和表型数据均来自明尼苏达双胞胎和家庭研究中心的测序研究,样本量为1431。所使用的模型为GREML模型,本文共构建了7个方差分量模型。第一,全基因组测序(WGS)模型:协变量性别作为固定效应,将所有全基因组测序得到的SNPs和亲缘关系作为随机效应。T为模型中随机效应的组分数,T1=2。第二,染色体分区模型:性别作为固定效应,将所有SNPs以常染色体划分为22个部分,连同亲缘关系作为随机效应,T2=23。第三,次要等位基因分区模型:把全基因组变异位点按照自身对应的次要等位基因频率分成的7个部分,连同亲缘关系作为随机效应,性别作为固定效应,T3=8。第四,编码功能分区模型:按照变异位点对应的编码功能进行分区,然后与亲缘系数一起作为随机效应,性别作为固定效应,T4=7。基于编码功能分区模型衍生出后面三个模型:根据SNPs是否属于与脑、肝、肾,将T4模型中解释遗传度最大的编码功能区划为两个组分,剩余所有SNPs作为一个分组,加之亲缘系数作为随机效应,性别为固定效应,T5=T6=T7=4。参数估计使用多组分限制性极大似然估计,所有模型使用GCTA软件包分析。结果:经过分析:我们发现全基因组SNPs共28,122,108个变异位点,WGS模型中解释了酒精依赖表型变异56%的遗传度。其中在常染色体分区模型中,8号和20号染色体的变异位点个数分别是1,589,142和624,750个,分别占全基因组的5.65%和2.22%,解释了遗传度的30%和21%,且各染色体长度与其所贡献遗传度的相关性无统计学意义(r=-0.28,p=0.22)。次要等位基因频率分区模型中,0.001<MAF≤0.01的变异位点共7,245,057个,占全基因组的25.8%,解释了55%的遗传度。编码功能分区模型中,脱氧核糖核酸酶I超敏位点(DHS)占了遗传变异的63%,呈4.4倍的富集。以酒精依赖相关器官分区的三个模型中,DHS-肝占遗传度的82%,呈17倍富集;DHS-脑和DHS-肾分别呈现10倍和8倍的富集。结论:本文使用全基因组测序数据,从全基因角度以及染色体、次要等位基因频率、编码功能等各个角度探索了酒精依赖的遗传结构。其中,8号和20号染色体占据总遗传度的一半以上,提示这两对染色体中存在效应较大的变异位点。而以MAF分区模型显示,遗传度估计中不能只考虑常见变异,罕见变异中也可能拥有较大影响的位点。编码功能分区模型验证了关于调控区基因变异对表型变异的重大作用。表型相关器官模型的分析显示,肝是影响酒精依赖的首要器官。通过本研究可得:全基因组测序数据能更准确、更全面的估计酒精依赖这类复杂性状的遗传度,为临床实践提供科学合理的依据。