论文部分内容阅读
宫颈癌严重威胁女性健康,据国际癌症研究署(International Agency for ResearchonCancer,IARC)最新数据统计,2012年全球宫颈癌新发病例约53万,死亡病例约27万,其中85%以上发生于发展中国家,居女性恶性肿瘤第2位。我国宫颈癌发病率约为12.0/10万,病死率约3.4/10万,由于人口基数大,绝对病例数位居世界前列,且呈现明显年轻化趋势。
目前已明确持续性感染的高危型人乳头状瘤病毒(human papillomavirus, HPV)是宫颈癌的主要致病因素。据报道99.7%的宫颈癌标本中都能检测到高危型HPV。大量性生活活跃的女性一生中不止一次感染高危型HPV。然而,绝大多数感染是一过性的,可在一年内通过自身免疫系统清除,且不到10%的感染发展成持续性感染,低于4%的感染会发展成癌前病变或宫颈癌,表明宿主遗传性和病毒之间存在复杂的相互作用。家系研究与基因遗传变异研究证据显示,不同遗传背景的个体对宫颈癌的易感性有显著不同。基因遗传变异可通过转录或转录后调控、氨基酸编码等机制影响基因的表达水平或蛋白功能,从而造成宫颈癌发病风险的人群差异。
近年来,全基因组关联研究(genome-wideassociationstudy,GWAS)已成为复杂性疾病包括肿瘤遗传易感性研究的一种强有力的策略。GWAS一般采用高通量的基因分型平台(如Affymatrix或Illumina芯片),基于LD连锁不平衡原理在基因组范围内选择具有代表性的标签位点(taggingSNP)进行检测,从而筛选出所有与疾病性状显著相关基因区域。2013年2月,一项瑞典女性人群宫颈癌GWAS研究发现6q21.32(rs2516448,rs9272143和rs3117027)与宫颈癌易感性有关。同年8月,《自然遗传》(NatureGenetics)首次刊登了中国汉族人群的宫颈癌全基因组关联研究,新发现4q12(rs13117307)和17q12(rs8067378)区域与宫颈癌发病风险显著相关。然而,GWAS识别的上述标签SNP绝大多数位于基因组非编码区域,真正影响宿主遗传易感性的功能性位点和潜在机制尚未明确。
此外,目前GWAS识别的位点仍仅能解释少部分宫颈癌的遗传易感性,存在明显的“遗传度”缺失现象。以往研究发现,长链非编码RNA(longnon-coding RNA,lncRNA)是一类转录长度超过200nt的内源性RNA分子,不参与蛋白质的编码。可在转录、转录后以及表观遗传学水平等三个层面,通过多种途径参与基因表达调控,影响细胞生长、发育、增殖分化、代谢和凋亡等重要生理过程。随着测序和芯片技术的发展,在肿瘤细胞中发现许多异常表达的lncRNA,证明lncRNA与各种肿瘤细胞的凋亡、侵袭和转移密切相关。而基因的遗传变异有可能改变lncRNA表达水平,从而影响肿瘤的发生、侵袭及转移。在宫颈癌中,lncRNAHOTAIR和MALAT-1已被证实可影响HPV16E6/E7癌蛋白的表达,参与宫颈癌的发生发展。然而,尚未有研究探讨lncRNAHOTAIR和MALAT-1功能性遗传变异与宫颈癌发病风险的关联。
第一部分GWAS鉴定区域(4q12和17q12)功能性遗传变异与宫颈癌易感性的关联研究
【目的】GWAS新发现4q12和17q12区域与中国汉族人群宫颈癌发病风险显著相关。然而,尚未明确这些区域内的功能性变异位点。为鉴定真正的致病位点,本研究拟对4q12和17q12区域进行精细作图研究。
【方法】采用基于医院的病例-对照研究设计,包括组织病理学确诊的1486例新发宫颈癌病例和1536例年龄和地区匹配的健康对照,所有研究对象均为无亲缘关系的汉族女性。基于SNP功能注释数据库RegulomeDB系统筛选获得16个SNP位点,通过SequenomMassARRAY平台进行基因分型检测并分析与宫颈癌发病风险的关联。
【结果】单因素相加模型分析发现,染色体17q12区域的rs8076131(A>G)和rs12150079(G>A)与宫颈癌发病风险的关联具有统计学意义(P值均为0.01)。基于多因素模型调整年龄、吸烟、绝经状态、胎次和肿瘤家族史等因素后,rs8076131G等位基因(相加模型:OR=1.15,95%CI=1.02-1.29,P=0.02)和rs12150079A等位基因(相加模型:OR=1.17,95%CI=1.02-1.34,P=0.02)均与宫颈癌的发病风险增加相关。将rs8076131和rs12150079危险等位基因进行联合分析,发现同携带0个危险等位基因相比,携带3-4个危险等位基因的个体发生宫颈癌的风险显著增加(OR=1.20,95%CI=1.07-1.44,P=0.003),趋势检验亦有统计学意义(P=0.01)。进一步对rs8076131和rs12150079与宫颈癌的关联进行分层分析,结果显示,rs8076131G和rs12150079A等位基因效应在年龄>50岁、初潮年龄>16岁、胎次≥2、无吸烟史和无肿瘤家族史人群中显著(P<0.05),但层间异质性检验无统计学意义(P>0.05)。RegulomeDB及GTEX数据库提示rs8076131可能影响KRT222、NR1D1、ORMDL3的表达,而rs12150079可能影响GSDMB的表达。
【结论】研究结果提示17q12区域rs8076131和rs12150079可能是相关区域内的功能性位点,可影响宫颈癌发病风险。
第二部分长链非编码RNA基因(HOTAIR和MALAT-1)的功能性遗传变异与宫颈癌易感性的关联研究
【目的】探讨lncRNAHOTAIR和MALAT-1的潜在功能性SNP位点与宫颈癌发病风险的关联。
【方法】采用RegulomeDB筛选获得lncRNAHOTAIR基因8个SNP位点,lncRNAMALAT-1基因6个SNP位点。所检测的病例对照样本及实验方法同第一部分。
【结果】单因素相加模型分析发现HOTAIRrs35643724(G>A)与宫颈癌发病风险增加有关(P=0.048),而MALAT-1rs1787666(A>C)与宫颈癌的发病风险降低有关(P=0.02)。基于多因素模型调整年龄、吸烟、绝经状态、胎次和肿瘤家族史等因素后,rs35643724(相加模型:OR=1.13,95%CI=1.00-1.28,P=0.047)和rs1787666(相加模型:OR=0.86,95%CI=0.76-0.97,P=0.01)与宫颈癌发病风险的关联仍具有统计学意义。将rs35643724和rs1787666危险等位基因进行联合分析,发现同携带0-1个危险等位基因的个体相比,携带2个危险等位基因(OR=1.29,95%CI=1.07-1.54,P=0.007)和3-4个危险等位基因(OR=1.18,95%CI=1.06-1.3,P=0.002)的个体发生宫颈癌的风险显著增加(趋势P值=0.001)。进一步对rs35643724和rs1787666与宫颈癌的关联进行分层分析,结果显示:rs35643724A在初潮年龄>16岁、胎次0-1、无吸烟史和无肿瘤家族史人群中显著,rs1787666C等位基因效应在初潮年龄?16岁、胎次0-1、绝经前、无吸烟史和有肿瘤家族史人群中显著,层间异质性检验初潮年龄亚组间有统计学意义(P<0.05),其余层间无统计学意义(P>0.05)。RegulomeDB数据及GTEX数据库提示rs35643724可能影响TBP的表达,而rs1787666可能影响NEAT1的表达。
【结论】HOTAIRrs35643724和MALAT-1rs1787666与宫颈癌易感性相关,其中rs35643724A等位基因可能增加宫颈癌的发病风险,而rs1787666C等位基因降低宫颈癌发病风险。
目前已明确持续性感染的高危型人乳头状瘤病毒(human papillomavirus, HPV)是宫颈癌的主要致病因素。据报道99.7%的宫颈癌标本中都能检测到高危型HPV。大量性生活活跃的女性一生中不止一次感染高危型HPV。然而,绝大多数感染是一过性的,可在一年内通过自身免疫系统清除,且不到10%的感染发展成持续性感染,低于4%的感染会发展成癌前病变或宫颈癌,表明宿主遗传性和病毒之间存在复杂的相互作用。家系研究与基因遗传变异研究证据显示,不同遗传背景的个体对宫颈癌的易感性有显著不同。基因遗传变异可通过转录或转录后调控、氨基酸编码等机制影响基因的表达水平或蛋白功能,从而造成宫颈癌发病风险的人群差异。
近年来,全基因组关联研究(genome-wideassociationstudy,GWAS)已成为复杂性疾病包括肿瘤遗传易感性研究的一种强有力的策略。GWAS一般采用高通量的基因分型平台(如Affymatrix或Illumina芯片),基于LD连锁不平衡原理在基因组范围内选择具有代表性的标签位点(taggingSNP)进行检测,从而筛选出所有与疾病性状显著相关基因区域。2013年2月,一项瑞典女性人群宫颈癌GWAS研究发现6q21.32(rs2516448,rs9272143和rs3117027)与宫颈癌易感性有关。同年8月,《自然遗传》(NatureGenetics)首次刊登了中国汉族人群的宫颈癌全基因组关联研究,新发现4q12(rs13117307)和17q12(rs8067378)区域与宫颈癌发病风险显著相关。然而,GWAS识别的上述标签SNP绝大多数位于基因组非编码区域,真正影响宿主遗传易感性的功能性位点和潜在机制尚未明确。
此外,目前GWAS识别的位点仍仅能解释少部分宫颈癌的遗传易感性,存在明显的“遗传度”缺失现象。以往研究发现,长链非编码RNA(longnon-coding RNA,lncRNA)是一类转录长度超过200nt的内源性RNA分子,不参与蛋白质的编码。可在转录、转录后以及表观遗传学水平等三个层面,通过多种途径参与基因表达调控,影响细胞生长、发育、增殖分化、代谢和凋亡等重要生理过程。随着测序和芯片技术的发展,在肿瘤细胞中发现许多异常表达的lncRNA,证明lncRNA与各种肿瘤细胞的凋亡、侵袭和转移密切相关。而基因的遗传变异有可能改变lncRNA表达水平,从而影响肿瘤的发生、侵袭及转移。在宫颈癌中,lncRNAHOTAIR和MALAT-1已被证实可影响HPV16E6/E7癌蛋白的表达,参与宫颈癌的发生发展。然而,尚未有研究探讨lncRNAHOTAIR和MALAT-1功能性遗传变异与宫颈癌发病风险的关联。
第一部分GWAS鉴定区域(4q12和17q12)功能性遗传变异与宫颈癌易感性的关联研究
【目的】GWAS新发现4q12和17q12区域与中国汉族人群宫颈癌发病风险显著相关。然而,尚未明确这些区域内的功能性变异位点。为鉴定真正的致病位点,本研究拟对4q12和17q12区域进行精细作图研究。
【方法】采用基于医院的病例-对照研究设计,包括组织病理学确诊的1486例新发宫颈癌病例和1536例年龄和地区匹配的健康对照,所有研究对象均为无亲缘关系的汉族女性。基于SNP功能注释数据库RegulomeDB系统筛选获得16个SNP位点,通过SequenomMassARRAY平台进行基因分型检测并分析与宫颈癌发病风险的关联。
【结果】单因素相加模型分析发现,染色体17q12区域的rs8076131(A>G)和rs12150079(G>A)与宫颈癌发病风险的关联具有统计学意义(P值均为0.01)。基于多因素模型调整年龄、吸烟、绝经状态、胎次和肿瘤家族史等因素后,rs8076131G等位基因(相加模型:OR=1.15,95%CI=1.02-1.29,P=0.02)和rs12150079A等位基因(相加模型:OR=1.17,95%CI=1.02-1.34,P=0.02)均与宫颈癌的发病风险增加相关。将rs8076131和rs12150079危险等位基因进行联合分析,发现同携带0个危险等位基因相比,携带3-4个危险等位基因的个体发生宫颈癌的风险显著增加(OR=1.20,95%CI=1.07-1.44,P=0.003),趋势检验亦有统计学意义(P=0.01)。进一步对rs8076131和rs12150079与宫颈癌的关联进行分层分析,结果显示,rs8076131G和rs12150079A等位基因效应在年龄>50岁、初潮年龄>16岁、胎次≥2、无吸烟史和无肿瘤家族史人群中显著(P<0.05),但层间异质性检验无统计学意义(P>0.05)。RegulomeDB及GTEX数据库提示rs8076131可能影响KRT222、NR1D1、ORMDL3的表达,而rs12150079可能影响GSDMB的表达。
【结论】研究结果提示17q12区域rs8076131和rs12150079可能是相关区域内的功能性位点,可影响宫颈癌发病风险。
第二部分长链非编码RNA基因(HOTAIR和MALAT-1)的功能性遗传变异与宫颈癌易感性的关联研究
【目的】探讨lncRNAHOTAIR和MALAT-1的潜在功能性SNP位点与宫颈癌发病风险的关联。
【方法】采用RegulomeDB筛选获得lncRNAHOTAIR基因8个SNP位点,lncRNAMALAT-1基因6个SNP位点。所检测的病例对照样本及实验方法同第一部分。
【结果】单因素相加模型分析发现HOTAIRrs35643724(G>A)与宫颈癌发病风险增加有关(P=0.048),而MALAT-1rs1787666(A>C)与宫颈癌的发病风险降低有关(P=0.02)。基于多因素模型调整年龄、吸烟、绝经状态、胎次和肿瘤家族史等因素后,rs35643724(相加模型:OR=1.13,95%CI=1.00-1.28,P=0.047)和rs1787666(相加模型:OR=0.86,95%CI=0.76-0.97,P=0.01)与宫颈癌发病风险的关联仍具有统计学意义。将rs35643724和rs1787666危险等位基因进行联合分析,发现同携带0-1个危险等位基因的个体相比,携带2个危险等位基因(OR=1.29,95%CI=1.07-1.54,P=0.007)和3-4个危险等位基因(OR=1.18,95%CI=1.06-1.3,P=0.002)的个体发生宫颈癌的风险显著增加(趋势P值=0.001)。进一步对rs35643724和rs1787666与宫颈癌的关联进行分层分析,结果显示:rs35643724A在初潮年龄>16岁、胎次0-1、无吸烟史和无肿瘤家族史人群中显著,rs1787666C等位基因效应在初潮年龄?16岁、胎次0-1、绝经前、无吸烟史和有肿瘤家族史人群中显著,层间异质性检验初潮年龄亚组间有统计学意义(P<0.05),其余层间无统计学意义(P>0.05)。RegulomeDB数据及GTEX数据库提示rs35643724可能影响TBP的表达,而rs1787666可能影响NEAT1的表达。
【结论】HOTAIRrs35643724和MALAT-1rs1787666与宫颈癌易感性相关,其中rs35643724A等位基因可能增加宫颈癌的发病风险,而rs1787666C等位基因降低宫颈癌发病风险。