论文部分内容阅读
研究背景及目的前列腺癌是最常见的男性泌尿系统肿瘤,在世界范围内的发病率排在第二位。而在中国前列腺癌则是增长速度最快的一种肿瘤,其发病率和死亡率的增长速度在所有癌症中均排在第一位。在精准医疗的大背景下,发现和利用有效的鉴别前列腺癌的生物标志物,开发靶向药物,是解决前列腺癌威胁的重要途径。前列腺癌是最具有遗传性的疾病之一,遗传因素约占疾病风险的42%,其中已发现的风险SNP占比超过40%,因此风险遗传变异位点是一种重要的候选生物标志物。迄今为止,GWAS已经鉴定出了 200多个前列腺癌风险相关SNP,但其作用机制仍不清楚,因此阐明这些风险SNP位点的生物学功能及其机制对前列腺癌精准医疗的发展具有十分重要的意义。通过GWAS确定的与各种疾病易感性相关的SNP中,95%以上的位点都不在基因的编码区,这给突变的功能研究带来了巨大的挑战。有研究表明这些风险SNP通常富集于基因转录调控区域,通过介导转录因子在这些区域的结合发挥增强子活性,调控靶基因的表达。因此通过报告基因分析系统筛选出具有基因调控功能的风险SNP位点,对于系统的解读这些位点的生物学功能及其机制具有十分关键的作用。由于风险SNP位点的数量非常庞大,我们急需一种高通量的报告基因分析系统。传统的萤光素酶报告基因分析系统具有通量低的缺点,而现有的基于DNA序列条码的报告基因分析系统由于存在序列偏爱性而表现出较大的系统误差。鉴于此,我们自行开发了一种基于二代测序的高通量报告基因分析系统,用于分析和筛选具有增强子活性的风险SNP位点。与现有的报告基因分析系统相比,该系统不仅可以高效、低成本的实现高通量的报告基因分析,结合qPCR技术还能兼顾常规通量水平报告基因分析的能力,在大大降低报告基因分析工作量和成本的同时,还降低了 DNA条码系统的偏爱性,减少了系统误差。研究结果1.从GWAS catalog数据库中摘取前列腺风险相关的SNP,并结合文献检索纳入共计213个前列腺癌易感性风险SNP位点,将每个SNP位点的风险和正常等位基因克隆到高通量报告基因分析系统中,获得了包含426个报告基因载体的质粒库。2.将报告基因质粒库分别转染22Rv1,PC3,LNCaP等3种前列腺癌细胞系,通过二代测序技术定量SNP的基因调控活性。在22Rv1,PC3,LNCaP细胞系中分别筛选出了 45个、22个和9个SNP位点,它们不仅具有基因调控活性,并且风险等位基因显著影响了基因的表达水平。更有趣的是,这些风险SNP位点的基因调控活性表现出了强烈的细胞特异性,这为进一步阐明风险SNP的功能提供了重要线索。3.通过FAIRE-qPCR分析发现,在22Rv1细胞中选出的具有基因调控活性的风险SNP中,有25个SNP区域的染色质呈高度开放状态,针对染色质活性标志物H3K4me3和H3K27ac的ChIP-qPCR分析表明rs684232和rs887391这两个SNP位点区域具有较高的富集倍数,并且对高转录活性等位基因表现出了强烈的选择性。我们推测,rs684232的风险等位基因破坏了正常增强子元件的活性,导致下游靶基因的表达下降,而rs887391的风险等位基因则大大促进了所在增强子元件的活性,增强下游靶基因的表达水平,从而导致前列腺癌风险。研究结论通过高通量报告基因分析系统鉴定具有基因调控活性的与前列腺癌易感性相关的风险SNP,探索其生物学功能和分子机制,希望在后GWAS时代帮助解读风险SNP导致疾病的机制,为前列腺癌的风险评估,精准诊疗提供帮助。