论文部分内容阅读
[研究背景]胃癌是世界范围内具有较高发病率和死亡率的恶性肿瘤,严重威胁人类生命健康。在中国,胃癌居恶性肿瘤死亡率第二位,具有严重的疾病负担,是肿瘤防治的重点。胃癌的发生是多因素、多阶段的复杂过程,是个体遗传因素和环境因素共同作用的结果。幽门螺杆菌(Helicobacterpylori,H.pylori)感染、新鲜蔬菜水果摄入较低、腌渍食物摄入过多和吸烟等是胃癌发生的主要环境危险因素。大型双生子研究表明胃癌的遗传度约为22%。端粒是位于染色体末端的由“TTAGGG”短串联重复序列和蛋白质组成的核蛋白复合物,在维持基因组稳定方面发挥重要作用。既往流行病学观察性研究表明,端粒长度与胃癌发生风险之间存在关联,但研究结果并不一致,两者之间的因果关系也并不明确。观察性研究往往会受到反向因果关联以及潜在混杂因素等的影响,导致其结果不可信。孟德尔随机化(Mendelian Randomization,MR)方法基于“亲代等位基因随机分配给子代”的孟德尔遗传定律,以与暴露因素有关的遗传变异作为工具变量(Instrumental variable,IV)推断暴露因素与研究结局的因果效应。MR方法得到的因果关联结果可有效避免混杂和反向因果关系带来的偏倚,为因果推断提供强有力的证据。近年来,随着全基因组关联研究(Genome-wide association studies,GWAS)用于众多疾病和性状的遗传学研究,MR方法已经作为病因推断的有效方法被广泛应用。端粒长度受到个体遗传因素的影响,遗传度约为34%-80%。迄今为止,GWAS已经发现并报道多个端粒长度相关的遗传区域,包括1q42.12、2p16.2、3p14.3、3q26.2、4q25、4q32.2、5p15.33、7q31.33、8q21.11、10q24.2、10q24.33、11q22.3、14q12、14q24.2、16q21、16q23.3、17p13.1、18p11.32、19p12 和 20q13.33。但是,已报道的遗传变异仅能解释一部分遗传度,且端粒长度的遗传决定因素因种族而异。GWAS背景下,往往存在多个与表型相关的遗传变异,由于单个位点的效应较弱、能解释的变异有限,因此MR方法利用GWAS数据库筛选多个合适的表型相关遗传变异作为Ⅳ,极大提高了检验效能。基于端粒长度GWAS研究,使用MR方法研究端粒长度与胃癌发生风险的关系,有助于阐明两者间的因果关联。本研究在中国人群中开展了端粒长度的GWAS研究,以发现新的端粒长度相关遗传变异。采用病例对照研究设计,使用MR分析方法评估外周血白细胞端粒长度与胃癌发生风险的关系。[研究方法]本研究使用定量PCR方法对本课题组既往完成基因组芯片检测的7305例对照样本进行端粒长度的检测,开展端粒长度GWAS研究,包括:(1)NJ TL-GWAS:使用 Affymetrix Genome-Wide Human SNP Array 6.0 芯片检测 1000 例健康样本;(2)Onco TL-GWAS:使用 Infinium(?)OncoArray-500K BeadChip 芯片检测 671例样本;(3)GSATL-GWAS:使用 Infinium(?)Global Screening Array(GSA)v1.0芯片检测 1708 例样本;(4)Guangzhou GSATL-GWAS Ⅰ:使用 Infinium(?)Global Screening Array(GSA)v1.0 芯片检测 1868 例样本;(5)Guangzhou GSA TL-GWASⅡ:使用 Infinium(?)Global Screening Array(GSA)v1.0 芯片检测 2058 例样本。各项GWAS均进行严格质控,遗传变异通过染色体位置、分型率、Hardy-Weinberger平衡(Hardy-weinberg equilibrium,HWE)以及次要等位基因频率(Minor allele frequency,MAF)标准进行质控,样本通过整体分型率、亲缘关系、杂合率和人群分层标准进行质控。使用SHAPEIT软件和IMPUTE2软件进行基因型填补,并针对填补后的SNPs进行进一步质控。使用SNPTEST软件分别进行关联分析,以相加效应模型计算单个遗传变异与Z-score标准化转换后的端粒长度的比值比(Odds ratio,OR)和 95%置信区间(95%confidence interval,95%CI)。关联分析使用线性回归模型,调整年龄、性别、吸烟以及前10个主成分(Principal components,PCs)。使用METAL软件的逆方差加权固定效应模型(Inverse-variance weighted fix effect model)对 5 项端粒长度 GWAS 进行 Meta分析,使用Cochran’s Q检验衡量各研究间的异质性,去除异质性I2≥75%或异质性检验P≤1.00×10-4的遗传变异,最终保留GWAS共有的5639661个SNPs。接着,基于本研究端粒长度GWAS Meta分析结果,本研究在6项胃癌GWAS数据库的10254例胃癌病例以及10914例对照中使用MR方法评估端粒长度与胃癌发生风险之间的关联。研究筛选出独立的端粒长度相关SNPs作为IVs,使用遗传风险评分方法(Polygenic risk score,PRS)和逆方差加权方法(Inverse-variance weighted method,IVW)评估端粒长度对胃癌发生风险的因果效应。为了评估结果的稳健性,本研究还按其他不同的标准筛选了端粒长度相关的独立的SNPs构建端粒长度PRS进行分析。同时,本研究通过敏感性分析评估研究结果的可靠性,包括:(1)进行异质性检验;(2)使用加权中位数方法评估因果效应;(3)使用Egger回归方法评估多效性所导致的偏倚;(4)基于已报道的12个胃癌相关SNPs构建胃癌风险PRS,在5项端粒长度GWAS数据库的7305例健康样本中进行反向MR分析。此外,为了评估端粒长度与胃癌发生风险之间的非线性关系,研究将端粒长度PRS按对照人群四分位数进行分组,使用Logistic回归模型分析不同等级PRS与胃癌发生风险之间的关联。使用限制性立方样条(Restricted cubic spline curve,RCS)方法探究端粒长度和胃癌风险之间的剂量-反应关系。[研究结果]本研究发现3个遗传区域与端粒长度存在关联(P<5.00×10-7),包括两个已报道的区域:3q26.2 区域的 rs2251795(OR=1.09,95%CI=1.05-1.12,P=2.83×10-7)和 5p15.33 区域的 rs7705526(OR=1.09,95%CI=1.06-1.13,P=1.12×10-7),以及新发现的 4p15.1 区域的 rs76923559(OR=1.16,95%CI=1.09-1.22,P=2.63×10-7)。此外,本研究发现既往已报道的18个区域中7个与端粒长度相关(P<0.05)。基于本研究关联P<5.00×10-7以及已报道的遗传区域,建立了 22个端粒长度相关SNPs构建的IVs,PRS方法与IVW方法均显示较短端粒长度与胃癌发生风险增加显著相关(PRS:OR=0.67,95%CI=0.54-0.83,P=2.84×10-4;IVW:OR=0.67,95%CI=0.52-0.87,P=3.00×10-3)。以其他不同标准筛选出的SNPs构建的2个端粒长度PRS与胃癌发生风险的关联结果效应方向一致并具有显著性(P<0.05)。异质性检验结果显示,遗传变异间并不存在显著异质性(P=7.61×10-2)。应用多效性容忍度较高的加权中位数方法也发现了显著关联(OR=0.69,95%CI=0.49-0.97,P=3.20×10-2),且 Egger 回归结果表明不存在显著的多效性(截距为0.009,95%CI=-0.011-0.030,P=0.37)。反向MR结果表明,端粒长度与胃癌发生风险之间不存在反向因果关联(OR=1.02,95%CI=0.95-1.09,P=0.58)。将PRS按四分位数分组的非线性分析及RCS分析均表明,端粒长度与胃癌发生风险之间不存在非线性关系(非线性检验P=0.61),端粒长度越短,胃癌发生风险越高。[研究结论]本研究在中国人群中开展端粒长度GWAS,发现位于3q26.2、5p15.33以及4p15.1区域的遗传变异可能参与端粒长度的调控,有助于阐明端粒长度的遗传调控机制。同时,本研究使用MR方法作出因果推断,发现较短端粒长度与胃癌发生风险增加有关,说明较短端粒长度在胃癌的病因学中发挥了重要作用,为深入了解胃癌的发生机制提供重要线索。