论文部分内容阅读
肺癌是人类最常见的恶性肿瘤之一,在工业化国家和我国许多城市已位居全部恶性肿瘤死因的首位。我国多数地区的肺癌发病率和死亡率在过去的20-30年间迅速增长,并将继续保持这一增长趋势,成为严重危害我国人民身体健康的主要疾病之一。研究表明80%以上的肺癌可归咎于烟草暴露,而仅仅不到10%的吸烟者发展为肺癌,提示个体对于肺癌具有遗传易感性。香烟的烟雾中已确认含有超过60种的致癌物,进入体内后,直接作用或经代谢活化后对机体造成损伤,其中最具潜在威胁的是对细胞DNA造成损伤,以致引起DNA序列的改变,增加增殖陛细胞的基因组不稳定性。在人体内,这些损伤可以通过DNA修复系统中的直接修复(DR),碱基切除修复(BER)和核苷酸切除修复(NER)等通路来修复,修复能力的不足可以增加个体肺癌的危险度。目前认为,不同个体DNA修复能力(DRC)的差异是由遗传决定的,可能是DNA修复通路中某些核心基因的多个功能性单核苷酸多态性的综合作用引起的。因此,我们的研究假设是:(1)DNA修复通路中重要功能性基因的SNPs单独或联合与肺癌易感性有关,且可能存在基因-基因和基因-环境交互作用;(2)DRC表型是由其相关重要修复基因的遗传变异决定的,个体之间修复能力的差异与其功能基因的SNPs息息相关。为验证上述假设(1),我们在深入剖析肺癌发生发展自然史及其危险因素的基础上,选择了不同修复通路中具有明确功能的10个代表性修复基因(XRCC1,ERCC1,ERCC2/XPD,ERCC3/XPB,ERCC4/XPF,ERCC5/XPG,XPA,XPC,DDB2/XPE,MGMT),采用分子流行病学病例-对照研究方法,综合运用“以序列为基础”和“以图谱为基础”的SNPs选点策略,以PCR-RFLP,Taqman和Illumina等目前常用的基因型检测技术,研究DNA修复基因多态性单独或联合与肺癌易感性的关系。同时,结合吸烟暴露评价基因-基因/基因-环境交互作用在肺癌发生中的作用。此外,我们还克隆了XRCC1的启动子区域,用报告基因体外转录实验研究了假设(1)中得到阳性关联的启动子区域位点对于基因转录的调控,阐述了该阳性关联可能的分子生物学机制。为验证上述假设(2),我们以烟草中最常见的多环芳烃类致癌物苯[a]芘的活性代谢产物BPDE作为诱导剂,用宿主细胞活性试验(HCR)检测了430名对照人群的DRC,与多个NER核心修复基因中常见的功能性多态性进行了相关分析。综上所述,本研究结果对于进一步评价和识别遗传与环境因素对于肺癌发生的危险性,阐明肺癌发生的分子遗传学机制及可能存在的DNA修复通路基因-基因/基因-环境交互作用等具有重要的理论和现实意义,方法学的部分对于其他类型肿瘤的分子流行病学研究具有一定的指导和借鉴价值。通过本研究发现的与我国人群肺癌易感性相关的危险基因型、单倍型,验证后可作为分子标志物用于筛选高危人群,对肺癌实施有效和目标明确的个体预防、早期诊断等均具有一定的意义。第一部分DNA修复基因遗传变异与肺癌易感性的关系第一节BER基因XRCC1功能性SNPs与肺癌易感性的关系XRCC1是BER通路中一个重要的修复基因,在修复烟草氧化性损伤和烟草特异性甲硝胺类致癌物NNK引起的N7-鸟嘌呤甲基加合物等方面起重要作用。许多研究显示,XRCC1中两个常见的引起氨基酸改变的错义单核苷酸多态性(Arg194Trp和Arg399Gln)与多种肿瘤风险相关。最近,我国的科研人员通过测序在XRCC1 5’-非翻译区域(UTR)发现了一个新的多态性位点-77 T>C,研究提示与我国食管癌的遗传易感性有关。为研究这三个潜在功能性位点对我国江苏汉族人群肺癌发病风险的影响,我们选择了经组织学确诊的710例新发肺癌病例及性别、年龄和地区(城乡)频数匹配的710例人群对照,通过PCR-RFLP的方法检测三个位点的基因型,用多元logistic回归模型和Bootstrapping方法计算各不同基因型的主效应及与吸烟的交互作用。同时,为研究-77T>C变异对于XRCC1基因转录的调控作用,我们扩增了XRCC1基因启动子区域1246bp的DNA序列(从转录起始上游1152bp至下游93bp),并分别将含有T和C等位基因的该DNA序列克隆入pGL3-Basic质粒载体中,用构建的载体转染了人乳腺癌细胞系MCF7,结肠癌细胞系HCT116(p53阳性和p53阴性),和肺癌细胞系NCI-H1299,通过相对荧光表达强度分析了启动子区T和C等位基因的转录活性。结果显示,XRCC1-77T>C的基因型频率在病例组和对照组间存在显著差异(P=0.0007),在调整了性别、年龄和吸烟等因素后,与携带XRCC1-77TT基因型者比较,携带-77TC基因型者患肺癌的风险显著增加了51%(OR=1.51,95%CI=1.17-1.94),携带-77CC基因型者患肺癌的风险则增加了198%(OR=2.98,95%CI=0.93-9.59)。进一步与累积吸烟量进行联合分析表明,与携带-77TT基因型的未吸烟者相比,携带-77TT基因型的轻度吸烟者(包-年≤30)和重度吸烟者(包-年>30)患肺癌的风险分别增加了1.66倍(OR=2.66,95%CI=1.91-3.71)和3.07倍(OR=4.07,95%CI=2.85-5.81),而携带-77TC/CC联合基因型的吸烟者肺癌发病风险增加更为显著(轻度吸烟者:OR=3.28,95%CI=2.05-5.23;重度吸烟者:OR=9.82,95%CI=5.66-17.02)。交互作用分析提示XRCC1-77位点的变异基因型与吸烟状态之间存在相加交互作用(P=0.027)。通过体外转录试验我们发现,含有突变型C等位基因的XRCC1报告基因在不同细胞系中产生的相对荧光表达强度是野生型T等位基因报告基因的57-64%。然而,本研究未发现XRCC1 Arg194Trp和Arg399Gln与肺癌易感性的显著关联。因此,我们认为XRCC1启动子区域-77T>C多态可能与中国人群肺癌遗传易感性有关,变异的C等位基因导致XRCC1转录活性下降。第二节NER核心基因标签SNPs与肺癌易感性的关系NER是与烟草所致损伤关系最为密切的修复途经,主要修复一些较大的DNA损伤,尤其是导致螺旋结构受损的,影响到复制和转录的损伤,如BPDE-DNA加合物等。很多重要的蛋白参与了NER过程,其中有一些蛋白的先天缺陷可以导致着色性干皮病(XP)表型,表现为对于日光极其敏感和高于普通人近2000倍的皮肤癌患病机率。研究显示,这些基因的多态性可能会影响个体对于肺癌的遗传易感性。本研究针对ERCC1,ERCC2/XPD,ERCC3/XPB,ERCC4/XPF,ERCC5/XPG,XPA,XPC和DDB2/XPE这8个NER通路的核心基因,运用连锁不平衡(LD)分析挑选了41个标签SNPs,采用多中心大样本病例-对照研究方法,以TaqMan中通量SNPs检测技术检测了1010名新发肺癌患者和1011名年龄、性别匹配的对照,来探讨NER核心基因的基因型/单倍型(haplotype)/双倍型(diplotype)与肺癌易感性的关系。在单位点分析中,有8个SNPs与肺癌显著相关,分别是rs830083,rs3781620,rs1007616,rs3212948,rs3136038,rs3731055,rs4150306,rs2296147。单倍型分析显示ERCC1 TCCCATT,ERCC2 ACGAA,ERCC3 TA以及DDB2 GG单倍型在病例组和对照组中的分布差异达到或接近统计学显著性水平(P<0.1)。与含有该基因其他单倍型的双倍型相比较,含有ERCC1 TCCCATT,ERCC3 TA,XPC ACCCA和DDB2 GG单倍型的双倍型与肺癌的患病风险符合共显性模型;同时,虽然ERCC4 TGG和ERCC5 CCCCAA单倍型在病例和对照之间的分布没有显著性差异,它们的双倍型与肺癌的发病风险符合显性或隐性模型。由此,我们在每个基因上选择一个单倍型来构建双倍型以表现该基因的遗传变异情况,以达到降维的目的。在以通路为基础的双倍型联合分析中,我们发现肺癌的患病风险随着危险双倍型的增加而增加,呈现很好的剂量-反应效应(P<0.0001)。与在3个或更少的NER核心基因上拥有危险双倍型者相比较,在4个以上的NER核心基因上拥有危险双倍型者肺癌风险增加63%(OR=1.63,95%CI=1.35-1.98),且这一危险度在有肿瘤阳性家族史和非吸烟者中更为显著。两分类的联合双倍型-吸烟在肺癌的发病中呈现显著的相乘交互作用(P=0.021),而两分类的联合双倍型-肿瘤家族史在肺癌的发病中呈现显著的相加交互作用(P=0.046)。本研究是目前为数不多的以通路为基础的多基因标签SNPs与肿瘤易感性的大样本病例-对照研究。本研究的结果进一步支持NER通路中多个低共显性遗传变异与肺癌的发病风险有关,但尚需得到进一步功能学研究的验证。第三节DR基因MGMT标签SNPs与肺癌易感性的关系MGMT是人体内唯一能将NNK所致O6-鸟嘌呤甲基加合物从DNA上移除,进行损伤修复的蛋白,但其表达在不同的个体中存在显著的差异。最近,Margison等人发现,MGMT的遗传变异可导致该基因在人外周血淋巴细胞中发生等位基因表达失衡,从而一定程度上解释了不同人群间MGMT表达水平或活性不同的原因。为全面了解MGMT的遗传变异在肺癌发生中的作用,本研究在深入分析MGMTLD结构的基础上,探讨了MGMT单倍型标签SNPs(htSNPs)与肺癌易感性的关系。本研究包含经组织学确诊的500例新发肺癌病例及性别、年龄频数匹配的517例社区人群对照。在综合考虑HapMap数据库中MGMTLD区段(block)结构、罕见等位基因频率(MAF)及位点的功能学意义的基础上,我们从HapMap、dbSNPs数据库和已发表的相关研究中选择了39个SNPs。所选SNPs通过Illumina高通量平台及PCR-RFLP的方法检测基因型,其中25个符合MAF>0.05。根据517名对照人群的基因型数据,我们按照Gabriel等人的方法重建了本地区汉族人群MGMT的LD区段结构,并在每个区段中以Stram等人的方法选择了10个htSNPs。研究表明,MGMT各单个位点的遗传变异对于肺癌的发生并无统计学意义的影响,但以block为基础的双倍型分析表明,携带单个拷贝block 3“12”单倍型的双倍型与不携带该单倍型的双倍型比较可以显著地降低个体患有肺癌的风险。此外,在不同累计吸烟量亚组,block 1、2组成的“22”单倍型,block 4的“22”单倍型,block 5的“12”单倍型和block 6的“12”单倍型在病例和对照组间的分布差异具有(或接近)统计学显著性水平(P<0.1),提示可能和吸烟存在交互作用。基于这些分析,我们在每个block上选择一个单倍型组成双倍型来表示该区段的遗传变异情况。以双倍型为基础的多因子降维(MDR)分析发现,block 3、block 5的双倍型、启动子区SNP rs1625649以及累积吸烟量等四个因子最终可以进入MDR的最佳模型。同时,block5的双倍型和累积吸烟量对于肺癌的发生具有相乘交互作用,而rs1625649多态性位点与吸烟状态对于肺癌的发生则具有相加交互作用。当对这些进入MDR模型的因子进行联合分析并二分类化,我们发现处在相对危险层的个体患肺癌的风险显著增加了3.10倍(OR=4.10,95%CI=3.12-5.37;P=2.09×10-24)。本研究采用以单倍型为基础的交互作用分析方法,首次报道了MGMT整个基因水平上的遗传变异与肺癌发病风险的关系,为探讨候选基因与肿瘤易感性关系的研究提供了一个可供参照的范例。第二部分DNA修复能力与NER功能性SNPs的关联研究在人体中,烟草暴露导致的BPDE-DNA加合物如不能得到及时修复,可以阻碍复制叉的移动和基因的转录。由此,Athas等人设计了一个通过检测报告基因表达能力来判断细胞DRC的方法:宿主细胞活性试验HCR。研究发现,DRC表型在预测肿瘤患病风险方面可以得到比较一致的阳性结论。最近,将这一表型作为肿瘤发生发展的一个中间节点,来反映相关DNA修复基因功能多态性的总和效应逐渐引起了研究者的兴趣。由于该表型提供了一个相对同质的研究NER通路功能性多态的环境,它有望在SNPs的关联研究方面取得比以疾病为研究终点的更好的可重复性。本研究在430名无肿瘤病史的非西班牙裔白人中探讨了NER通路中7个潜在功能性SNPs与DRC(基因型-表型)的相关性。DRC通过HCR法检测外周血淋巴细胞得到;多态性通过SNPlex中通量检测技术和PCR-RFLP方法检测。我们选择了NER核心基因中目前所知的所有常见的错义SNPs(nsSNP)和调节性SNPs(rSNP):XPA 5’UTR的G-4A(rs1800975),XPC Ala499Val(rs2228000)和Lys939Gln(rs2228001);ERCC2 Asp312Asn(rs1799793)和Lys751Gln(rs13181),ERCC5 His1104Asp (rs17655)以及ERCC1 3’UTR的C8092A(rs3212986)。结果显示年龄、性别、累积吸烟量、饮酒情况和肿瘤家族史与DRC无显著相关性。单个位点的分析发现,ERCC2 Lys751Gln,ERCC5 His1104Asp和XPC Lys939Gln的不同基因型间DRC的差异符合显性遗传模型。同时,DRC水平还与ERCC2 Lys751Gln,ERCC5His1104Asp和XPC Lys939Gln存在显著的剂量-反应效应,符合共显性模型。显性模型联合分析时此剂量-反应关系更为明显(连续性变量趋势性检验P<0.0001;分类变量趋势陛检验P=0.0001),携带2个以上危险组合基因型的个体与DRC的降低显著相关(OR=2.11,95%CI=1.36-3.26)。基因-基因交互作用分析提示ERCC1 3’UTR位点G1830T与ERCC5 His1104Asp在对DRC的影响中存在相乘交互作用。本研究的结果论证了进行大样本多位点分析DRC表型与相关修复基因多态性关联的可行性,BPDE作用下NER特异的DRC与修复基因变异的研究有助于检出相应肿瘤模型下的易感人群。