论文部分内容阅读
研究背景及目的:结核病(Tuberculosis,TB)是由结核分枝杆菌(Mycobacterium Tuberculosis,M.tb)引起的一种慢性传染病,仍然是全球范围内导致死亡的主要原因之一,严重地威胁到了人类的健康。长链非编码RNA(long non-coding RNA,lncRNA)是一类长度大于200个核苷酸的非编码RNA,随着相关研究的深入,越来越多的研究发现lncRNA与人类的疾病的发生发展密切相关。研究较多且比较成熟的机制之一就是竞争性内源RNA(competing endogenous RNA,ceRNA)基因表达调节机制。该机制认为lncRNA可以通过与miRNA结合,从而调控miRNA靶基因的表达,进而影响生命过程。因此,本研究在通过构建活动期结核病患者PBMC(peripheral blood mononuclear cell)中以lncRNA为核心的分子调控网络,并进行基本分析,为疾病的研究和诊断提供线索。材料及方法:通过GEO Datasets数据库搜集获得活动期结核病患者外周血单个核细胞lncRNA和mRNA的基因表达数据集。利用R语言中Combat包对多个mRNA表达谱进行整合、批次校正和标准化,应用limma包的mRNA和lncRNA对表达数据集进行分析,得到差异表达基因。通过miRcode数据库对差异表达的lncRNA靶向的miRNA进行生物信息学预测,然后利用多个miRNA数据库(miRDB、miRTarBase、TargetScan)预测出差异表达的miRNA调控的靶基因并与差异表达的基因对比分析,将miRNA预测的靶基因并不包含在差异表达mRNA其中的排出在外,从而确定需要研究的重点关注基因。依次构建lncRNA-miRNAmRNA ceRNA调控网络。对ceRNA调控网络中的重要差异基因进行基因的功能注释分析(GO-Analysis)和基因的信号通路富集分析(Pathway-Analysis)。通过STRING在线分析工具对调控网络中的差异基因进行分析,构建蛋白质—蛋白质相互作用(protein-protein interaction,PPI)网络,并通过Cytoscape(版本3.4.0)软件进行可视化。依据上述生信分析结果,采用芯片数据分析验证lncRNA与mRNA表达量之间的关系及相关miRNA的表达量。采用qRT-PCR验证关键基因的表达水平,并分析其与GEO数据分析结果趋势是否一致。实验结果:本研究收集到4个基因表达谱原始数据集(35个活动期结核患者,30个健康捐献者),一个芯片表达验证数据集(9个活动期结核患者,9个健康捐献者),利用limma包筛选获得32个差异表达lncRNA,747个差异表达mRNA。并依次构建了26个lncRNA,59个mRNA及32个预测的miRNA的lncRNA-miRNA-mRNA全局调控网络,对调控网络中的59个差异表达基因进行功能注释显示这些基因参与到了20个(P<0.001)GO生物过程(BP),信号通路富集分析显示这些基因参与到6个(P<0.05)KEGG信号通路。并对ceRNA调控网络中的59个差异表达基因进行PPI网络分析。用芯片数据验证对PPI网络和关注的KEGG信号通路中的基因进行验证,其中CCD2、E2F5、JAK2、MYC、PTGS2、RRAS2、SOD2的表达得到了验证。芯片数据分析lncRAN与mRNA表达量关系的结果显示FAM157B与EGR2,RP11-290F20.3.1与IRF1,RP11-213H15.3.1与PTGS2,RNU12与RRAS2表达均呈现正相关趋势。miRNA表达量的芯片验证结果显示,hsa-miR-137、hsa-miR-301b-3p呈现高表达水平。通过qRT-PCR检测基因EGR2、IRF1、PTGS2和RRAS2在活动期结核病患者PBMC中的mRNA的表达水平。其中IRF1表达水平上调,RRAS2的表达水平下调,其结果与多芯片联合分析结果一致。结论:(1)基于GEO数据库,筛选得到结核病患者外周血单个核细胞中lncRNA和mRNA的差异表达谱,并以此构建了lncRNA介导的lncRNA-miRNA-mRNA ceRNA调控网络。(2)构建了结核患者外周血单个核细胞差异基因PPI网络。(3)实验验证了调控网络中的分子EGR2、IRF1、PTGS2和RRAS2的mRNA的表达水平。