论文部分内容阅读
目的:骨关节炎作为最常见的骨科疾病之一,长久以来一直威胁着人们的健康,随着社会老龄化的发展,这一问题更加突出。但骨关节炎的病因及分子机制一直未得到阐明。既往针对骨关节炎发病机制中,针对软骨的病变研究最为广泛,但针对滑膜及软骨下骨的发病因素研究却很少。本研究利用生物信息学技术更加全面的探究骨关节炎发病的分子机制。方法:本研究从芯片数据库GEO数据库中下载了骨关节炎滑膜的测序样本GSE82107和软骨下骨的测序样本GSE51588。并利用GEO2R对两组样本进行了差异基因的筛选,用p<0.05和|log FC|>1作为差异显著、差异倍数2倍以上筛选条件。再将得到的差异基因通过Metascape网站进行GO分析和KEGG分析,对差异基因进行富集分析和功能注释。接着我们运用STRING在线工具分析对差异基因DEGs进行分析,构建了以差异基因为基础的PPI分子网络(protein protein interaction network,PPI network),置信分数(confidence score)>0.4为有统计学意义;然后将STRING分析所得的PPI互作结果输入Cytoscape进行可视化,随后我们用MCODE(Molecular Complex Detection)插件对PPI网络中紧密连接的模块区域进行检测,参数设置如下:MCODE scores>5,degree cut-off=2,node score cut-off=0.2,Max depth=100以及k-score=2。我们根据Degree>10的原则运用Cyto Hubba筛选关键基因,并对这些基因的表达调控情况进行注释。betwweennes和bottleneck作为对Degree的补充指标,用来识别网络中的数据中心基因。最后将Degree>20的前10个基因作为关键基因,用GTEx数据库对基因表达的组织特异性进行调查。结果:用GEO2R对数据进行差异基因的分析,在GSE82107中共筛选出3805个差异基因,其中上调的基因689个,下调的基因3116个;在GSE51588中共筛选出2298个差异基因,其中上调的基因1390个,下调的基因908个,两个数据集重叠所得的基因共355个。GO分析和KEGG分析结果发现差异基因主要富集在NABA核心基质、骨化、结缔组织发育和发展性生长等生物过程和通路上。我们将MCODE鉴定出来的关键模块的功能运用metascape进行分析,发现主要富集在NABA核心基质、酗酒和Gα(i)信号事件。运用cytoscape中的cytohubba插件进行分析,共得到degree>10的关键基因38个,其中上调的基因共17个,下调的基因共15个,在两组标本里调控方向有差异的基因共6个。将Degree>18的前10个基因作为数据中心关键基因,其中最为显著的为FN1。GTEx数据库对基因表达的组织特异性进行调查发现FN1,MMP2,RUNX2,LUM,COL1A1,COL6A2在转化成纤维细胞中的表达具有较高的组织特异性。结论:本研究旨在提供一个更全面的角度去认识骨关节炎,并对滑膜和软骨下骨的DEGs进行了筛选,并鉴定了关键模块的功能与一些关键基因,这些都有可能成为对骨关节炎研究的新切入点。但这些都仍是数据层面的预测,仍需要通过大量的实验来进行验证。