论文部分内容阅读
目的:
探究吸烟是否会影响肺鳞癌(LungSquamousCellCarcinoma)患者机体内基因表达状况,探究其基因表达差异,确定表达差异基因参与的生物学功能和信号通路;通过探讨吸烟与DNA甲基化以及基因表达之间的相关性,得出其对肺鳞癌的影响。
分析方法:
本次研究从TCGA(TheCancerGenomeAtlas,癌症基因组图谱数据库)数据库收集肺鳞癌的数据,其中临床样本信息共504例,甲基化数据共371例,RNA-seq数据共502例。采用数据挖掘技术,包括PCA(PrincipalComponentsAnalysis,主成分分析),GO_BP(GeneOntology_BiologicalProcess,基因本体_生物学过程),KEGG富集分析(KyotoEncyclopediaofGenesandGenomes,京都基因与基因组百科全书),ChAMP(ChipAnalysisMethylationPipeline,芯片分析甲基化),Limma差异分析,DAVID(TheDatabaseforAnnotation,VisualizationandIntegratedDiscovery,DAVID生物信息数据库)等方法。RNA-seq数据中,FPKM值作为衡量基因表达水平高低的指标,甲基化数据中,beta值作为衡量基因甲基化水平高低的指标。选取的每个样本均有完整的临床信息,包含患者吸烟量。
分析结果:
1,在对TCGA样本进行PCA分析后,发现吸烟组和非吸烟组无法分开。
2,对RNA-seq的吸烟组和非吸烟组进行limma差异分析,得到1210个差异基因,其中799个为吸烟组相对非吸烟组的上调基因,411为下调基因。
3,使用GO_BP对上调基因和下调基因进行功能富集分析,其中炎症反应,树突细胞趋化作用,免疫反应,胞质钙离子浓度的正调节,G蛋白偶联受体信号通路和趋药性6个生物学功能为上调差异基因的主要功能。而蛋白泛素化和核小体装配为主要下调差异基因的富集途径。
4,使用KEGG对上调基因进行功能富集,其中,细胞因子间受体相互作用,趋化因子信号途径,rap信号途径,神经刺激性配体受体相互作用为主要上调差异基因的富集途径。
5,对甲基化数据样本进行聚类分析和甲基化beta值分布分析,结果显示出明显差异。
6,对TCGA甲基化样本进行PCA分析,发现吸烟组和非吸烟组无法分开。
7,对甲基化数据进行circos图分析,得到甲基化岛大部分都分布在X染色体上,受到影响的基因也大部分为X染色体上的基因,受到影响的基因一共有87个。
8,对吸烟组和非吸烟组的甲基化和表达数据进行综合分析,得到30个反向相关的基因,并利用VarElect数据库比对,得到XIAP,SYP,HSPA1A,AIFM1,PGK1,ELK1,TSPAN7,FOXL2,PQBP1,NDUFA1为十个与肺癌相关度最大的基因,其中XIAP,SYP,HSPA1A,AIFM1四个基因分值最高。
结论:
1,从遗传学的角度,吸烟会影响人体内基因的表达,从而影响机体内的新陈代谢及稳态。
2,从表观遗传学角度,吸烟会通过影响相关基因的DNA甲基化状态而影响基因的活化与失活,从而对肺鳞癌的发生发展产生不可忽视的影响。
3,DNA甲基化状态可能与性别直接相关,这可能与男性吸烟率明显大于女性有关。
4,肺鳞癌与吸烟关系密切,戒烟将会大大降低罹患肺鳞癌的风险。
5,去甲基化将成为未来肺鳞癌的治疗方案,其中,XIAP,SYP,HSPA1A,AIFM1这四个基因将有可能成为治疗的有效靶点。
探究吸烟是否会影响肺鳞癌(LungSquamousCellCarcinoma)患者机体内基因表达状况,探究其基因表达差异,确定表达差异基因参与的生物学功能和信号通路;通过探讨吸烟与DNA甲基化以及基因表达之间的相关性,得出其对肺鳞癌的影响。
分析方法:
本次研究从TCGA(TheCancerGenomeAtlas,癌症基因组图谱数据库)数据库收集肺鳞癌的数据,其中临床样本信息共504例,甲基化数据共371例,RNA-seq数据共502例。采用数据挖掘技术,包括PCA(PrincipalComponentsAnalysis,主成分分析),GO_BP(GeneOntology_BiologicalProcess,基因本体_生物学过程),KEGG富集分析(KyotoEncyclopediaofGenesandGenomes,京都基因与基因组百科全书),ChAMP(ChipAnalysisMethylationPipeline,芯片分析甲基化),Limma差异分析,DAVID(TheDatabaseforAnnotation,VisualizationandIntegratedDiscovery,DAVID生物信息数据库)等方法。RNA-seq数据中,FPKM值作为衡量基因表达水平高低的指标,甲基化数据中,beta值作为衡量基因甲基化水平高低的指标。选取的每个样本均有完整的临床信息,包含患者吸烟量。
分析结果:
1,在对TCGA样本进行PCA分析后,发现吸烟组和非吸烟组无法分开。
2,对RNA-seq的吸烟组和非吸烟组进行limma差异分析,得到1210个差异基因,其中799个为吸烟组相对非吸烟组的上调基因,411为下调基因。
3,使用GO_BP对上调基因和下调基因进行功能富集分析,其中炎症反应,树突细胞趋化作用,免疫反应,胞质钙离子浓度的正调节,G蛋白偶联受体信号通路和趋药性6个生物学功能为上调差异基因的主要功能。而蛋白泛素化和核小体装配为主要下调差异基因的富集途径。
4,使用KEGG对上调基因进行功能富集,其中,细胞因子间受体相互作用,趋化因子信号途径,rap信号途径,神经刺激性配体受体相互作用为主要上调差异基因的富集途径。
5,对甲基化数据样本进行聚类分析和甲基化beta值分布分析,结果显示出明显差异。
6,对TCGA甲基化样本进行PCA分析,发现吸烟组和非吸烟组无法分开。
7,对甲基化数据进行circos图分析,得到甲基化岛大部分都分布在X染色体上,受到影响的基因也大部分为X染色体上的基因,受到影响的基因一共有87个。
8,对吸烟组和非吸烟组的甲基化和表达数据进行综合分析,得到30个反向相关的基因,并利用VarElect数据库比对,得到XIAP,SYP,HSPA1A,AIFM1,PGK1,ELK1,TSPAN7,FOXL2,PQBP1,NDUFA1为十个与肺癌相关度最大的基因,其中XIAP,SYP,HSPA1A,AIFM1四个基因分值最高。
结论:
1,从遗传学的角度,吸烟会影响人体内基因的表达,从而影响机体内的新陈代谢及稳态。
2,从表观遗传学角度,吸烟会通过影响相关基因的DNA甲基化状态而影响基因的活化与失活,从而对肺鳞癌的发生发展产生不可忽视的影响。
3,DNA甲基化状态可能与性别直接相关,这可能与男性吸烟率明显大于女性有关。
4,肺鳞癌与吸烟关系密切,戒烟将会大大降低罹患肺鳞癌的风险。
5,去甲基化将成为未来肺鳞癌的治疗方案,其中,XIAP,SYP,HSPA1A,AIFM1这四个基因将有可能成为治疗的有效靶点。