论文部分内容阅读
乳腺癌是女性最常见的一种与遗传突变及表观遗传修饰异常密切相关的异质性肿瘤.多种癌基因激活和抑癌基因失活相互协调的多步骤累积变化是乳腺癌发生发展的分子基础.因此,探索筛选新型乳腺癌原癌和抑癌基因是阐明发生发展机制的关键.同时,具有极大的推动早期诊断、精准靶向治疗、预后预测等临床研究和转化应用作用.异常DNA甲基化修饰导致的基因表达,在乳腺癌的发展过程中起着举足轻重的调控作用.DNA与蛋白互相作用是基因调控,染色质稳定性和DNA复制中必不可少的关键机制.染色质免疫沉淀测序(ChIP-seq)已被迅速应用为全基因组蛋白质-DNA作用模式的标准实验技术.其中,DNA甲基化免疫共沉淀高通量测序技术(MeDIP-Seq)可检测出与转录因子结合的DNA区域和甲基化位点.最近,随着各种全基因组甲基化检测技术的应用,数百种新的甲基化候选基因据报道与乳腺癌有关.但是,这些研究大部分都是全基因组谱分析普遍性的甲基化基因.DNA甲基化易感基因是指正常上皮细胞中CpG岛非甲基化,但是在肿瘤细胞中CpG岛处于高度甲基化的基因.大多数基因,启动子区域的DNA甲基化模式改变时会出现失去RNA聚合酶Ⅱ(PolⅡ)的亲和力,丧失转录水平,导致癌症的发生.然而,部分基因不符合此特征,这些少数基因报道甚少.还有很多未被发现的调控因子待研究.蛋白H3赖氨酸27位点三甲基化(H3K27me3)在沉默基因转录表达中起着至关重要的作用.高通量测序检测出的甲基化位点包括DNA甲基化位点和组蛋白甲基化位点,要找出原发性DNA甲基化的基因,就需要去除H3K27me3组蛋白甲基化的位点. 目的: 1.比较研究乳腺正常上皮细胞和乳腺癌细胞样本的转录组测序结果差异,并筛选新型乳腺癌相关基因. 2.探讨区分候选基因表达沉默的原因.主要验证H3K27me3的沉默作用. 3.探讨新型表达差异性基因在乳腺癌细胞水平和组织学水平上的表达情况,探寻它的发病机理,为临床诊断提供依据. 方法: 1.采用ChIP方法分别获得正常乳腺上皮细胞株HMEC、乳腺癌细胞株MCF-7中与5-甲基胞嘧啶、RNA聚合酶II、蛋白H3赖氨酸27上三甲基化(H3K27me3)结合的DNA片段,进行构建文库(包括末端修复、加A、加接头、长度筛选、PCR扩增)并进行高通量测序,获得5-甲基胞嘧啶(5m)、PolⅡ(S)、H3K27me3(H3)的特异性片段.采用MACS2软件预测IP实验的片段大小(frag-sizes),分析其对应的基因片段分布,根据峰检出筛选出峰的相关基因. 2.差异基因筛选:利用不同实验组峰(peak)的富集(FoldEnrich)值进行差异分析.当比值富集大于2时为组间差异peak,从而获得不同实验的差异结合位点.通过差异结合位点定位找到与差异位点相关基因. 1)找出正常乳腺上皮细胞株HMEC对应的5m、S、H3共有的结合位点,为N-5m,N-S,N-H3; 2)找出MCF-7细胞株对应的的5m、S、H3共有的结合位点,为T-5m,T-S,T-H3; 3)筛选出DNA甲基化易感基因:即找出在T-5m结合的位点中,比N-5m结合上调的位点; 4)在3)的基础上筛选出T-5m,T-S共有的结合位点; 5)在4)的基础上找出与T-H3共有的结合位点; 6)在4)的基础上去除T-H3共有的结合位点. 得到的结合位点定位通过软件找到所需要的差异基因. 3.通过DAVID数据库中的GO(Gene Ontology)与KEGG通路(Kyoto Encyclopedia of Genes and Genomes),对有差别的甲基化基因进行深入的功能及通路的生物学分析. 4.采用荧光定量PCR(Quantitative Real-time PCR,qPCR)技术检测这些新型基因在正常乳腺上皮细胞株HMEC、乳腺癌细胞株MCF-7中的表达差异性. 5.采用荧光定量PCR(Quantitative Real-time PCR,qPCR)技术检测这些新型基因在内蒙古医科大学附属医院采集的8例乳腺癌组织及对应癌旁组织中的表达差异性. 6.统计学分析采用SPSS22.0统计软件,P<0.05认为差异有统计学意义. 结果: 1.对乳腺癌细胞和正常乳腺上皮细胞进行ChIP-seq分析发现,结合RNA聚合酶Ⅱ的差异性DNA甲基化易感基因有20个,其中启动子区域存在H3K27me3的有3个,不存在H3K27me3的差异基因有17个. 2.对表达差异基因进行GO富集分析,主要包括在细胞、蛋白质修饰、代谢、大分子修饰、生物和代谢等过程的调节因子. 3.对差异基因进行KEGG通路富集分析,主要有新陈代谢、细胞过程、染色质调控和人类疾病等通路. 4.荧光定量PCR结果显示,新型乳腺癌相关基因在HMEC、MCF-7细胞中具有表达差异性,差异有统计学意义(P<0.05). 5.荧光定量PCR结果显示,新型乳腺癌相关基因在乳腺癌组织及对应癌旁组织中的表达水平有差别,并有统计学意义(P<0.05). 结论: 1.发现具有转录水平(结合RNA聚合酶Ⅱ)并发生DNA甲基化的新型乳腺癌相关基因20个. 2.这些基因中,启动子区域H3K27三甲基化的基因有3个,另外17个基因可能是原发性地由DNA甲基化引起的基因表达变化. 3.筛选出的新型乳腺癌相关基因可能与乳腺癌的发生发展相关,还待进一步研究其分子机理.