论文部分内容阅读
目的:对TCGA数据库中大样本结直肠癌基因表达谱RNAseq数据进行生物信息学分析,以期挖掘出与结直肠癌发生、发展及预后相关的关键基因及其所在的信号通路,为更好地理解结直肠癌发生的分子机制及预后监测提供参考。方法:从TCGA数据库下载结直肠癌RNAseq数据,采用R-DESeq软件包筛选差异表达基因,应用DAVID在线工具对差异表达基因进行GO功能注释分析,使用R-clusterProfiler包和R-pathview包对差异基因进行KEGG信号通路分析,运用STRING数据库和Cytoscape软件对差异基因编码的蛋白质进行蛋白互作网络分析,初步鉴定结直肠癌有关的关键基因及其所在的信号通路;采用R-survival包对差异表达基因进行生存分析,筛选出与结直肠癌预后有关的基因。结果:(1)筛选出结直肠癌差异表达基因共4017个,其中表达上调的基因1653个,表达下调的基因2364个。(2)GO富集分析发现,上调的差异表达基因主要富集的分子功能是蛋白结合、丝氨酸内肽酶活性、细胞外基质的结构组成等;主要富集的生物学过程为细胞分裂、有丝分裂核分裂、DNA复制、有丝分裂细胞周期的G1/S期转变等;主要富集的细胞组分有核浆、蛋白质的细胞外基质、细胞核等。KEGG信号通路分析发现,上调的差异表达基因主要富集在细胞周期、p53信号通路、真核生物核糖体生物合成、凝血级联通路、DNA复制等信号通路。(3)GO富集分析显示,下调的差异表达基因主要富集的分子功能是肝素结合、受体结合、受体活性、腺苷酸环化酶结合等;主要富集的生物学过程有细胞黏附、细胞钙离子浓度的正调节、肌肉挛缩、钠离子转运等方面;主要富集的细胞组分有质膜、等离子体膜的组成部分、膜的有机组成部分等。KEGG信号通路分析显示,下调的差异基因主要富集的信号通路有钙离子信号通路、昼夜夹带、细胞色素P450药物代谢通路、神经活性的配体-受体相互作用、cGMP-PKG信号通路等。(4)蛋白质互作网络分析显示,上调差异表达基因编码的蛋白构建的互作网络(PPI)中的核心基因(degree≥20)有8个,分别是CDK1、CCNB1、BUB1、PLK1、TOP2A、PCNA、MAD2L1、KIF20A;下调差异表达基因编码蛋白质构建的PPI中的核心基因(degree≥40)有10个,分别是GNG7、GNG13、GNG12、GNG2、ADCY9、ADCY5、LPAR1、BDKRB2、CASR、GNAI1。(5)Kaplan-Meier生存分析发现有17个基因与结直肠癌预后明显相关,其中BRIP1、CENPE、ABCD3、NAT2、AQP8、SUCLG2、GPD1L、GNG12、ABHD6、PARM1和NIPAL1这11个基因高表达时,患者的生存期显著提高,而CDKN2A、DMPK、MPP2、SGCA、NCS1、SLITRK2这6个基因高表达时,患者的生存期却明显下降。其中ABCD3、DMPK、MPP2、SGCA、SUCLG2、NCS1、GNG12和NIPAL1这8个基因尚属首次发现。结论:(1)成功筛选出结直肠癌的差异表达基因,并对其进行GO分析和KEGG通路分析,揭示了差异表达基因的分子功能及其主要涉及的肿瘤相关信号通路,为结直肠癌发生分子机制的研究提供了理论基础。(2)成功构建了结直肠癌差异表达基因的蛋白互作网络图,初步鉴定出CDK1、CCNB1、BUB1、PLK1、TOP2A、PCNA、MAD2L1、KIF20A、GNG7、GNG13、GNG12、GNG2、ADCY9、ADCY5、LPAR1、BDKRB2、CASR、GNAI1共18个基因是结直肠癌相关的关键基因。(3)生存分析识别出17个基因与结直肠癌预后明显相关,其中BRIP1、CENPE、ABCD3、NAT2、AQP8、SUCLG2、GPD1L、GNG12、ABHD6、PARM1和NIPAL1这11个基因高表达可改善结直肠癌患者预后,而CDKN2A、DMPK、MPP2、SGCA、NCS1、SLITRK2这6个基因高表达与结直肠癌患者预后差相关。本研究结果为临床上结直肠癌的诊治提供新的靶点和预后标志物奠定了基础。