论文部分内容阅读
目的:本研究采用芯片分析技术和文本挖掘技术对腰椎间盘退变性疾病进行生物信息学分析,旨在通过构建差异调控网络、蛋白质互作网络和生物学通路之间交互作用网络,从分子生物学的角度来阐明腰椎间盘退变性疾病发生、发展可能机制,为改进腰椎间盘退变性疾病治疗方案提供可能。方法:1.基于下载的不同退变程度腰椎间盘的芯片数据,我们利用T检验的方法对其进行基因差异表达的计算,选择合适的阈值筛选出疾病的差异表达基因。然后进行基因功能分析、蛋白质与蛋白质相互作用网络分析与聚类分析,最终得到在腰椎间盘退变过程中的重要基因和代谢通路。2.采用基因芯片分析技术对下载的不同退变程度腰椎间盘的芯片表达谱数据进行差异共表达分析,得到每个基因相应的p值和FDR值,以及基因与基因间的相关性。然后选取FDR <0.25作为筛选差异共表达基因的阈值。随后又对差异共表达基因进行了功能分析和网络分析。3.利用基于自然语言处理方法的文本挖掘技术对腰椎间盘退变进行分子网络分析。分析文本挖掘得到的分子作用关系,筛选出疾病相关突变基因的分子作用网络。最后对网络进行功能富集分析。结果:1.对37个腰椎间盘组织样本的基因表达谱芯片进行分析,通过基因芯片差异分析(SAM),获取椎间盘退变程度不同样本间的差异表达基因,得到555个在严重椎间盘退变中具有高表达的差异表达基因。对这些差异基因进行功能富集分析,发现这些差异基因与膜结合小泡,钙离子结合蛋白和胞外基质密切相关。蛋白相互作用分析显示这些基因在椎间盘退行性病变的过程中起着重要的作用,这些差异表达的基因包括纤连蛋白基因和β-连环蛋白基因。非监督聚类分析显示,基于汤姆森分级系统的椎间盘退行性疾病的形态分类与基于分子水平上椎间盘类型的分类具有显著的相关性。2.对不同发展程度的腰椎间盘突出和退变性腰椎间盘疾病的基因表达数据进行差异共表达分析,得到539个差异共表达基因和差异共表达基因间有显著相关性的差异共表达基因关系113866对。对这539个差异共表达基因进行KEGG富集分析,结果发现最显著富集的10个子通路。将得到的113866对差异共表达基因调控关系对与已知的TF与TG关系对进行对比,得到在其中62对在腰椎间盘突出和退变性腰椎间盘疾病发展过程中作为TF和TG的调控关系对,可认为这62对调控关系对(其中TG有44个)是造成腰椎间盘退变性疾病发展的分子机制中表达水平上最终导致表达差异的一步。3.采用文本挖掘技术对腰椎间盘退变性疾病进行分析,结果发现,得到了52518个人类分子互作关系对,其中有27526个是人与老鼠同源的分子关系对。通过MGI我们得到了与腰椎间盘退变性疾病相关的8个表型,然后筛选出与这8个表型相关的36个基因。最后与得到的人类分子互作网络进行整合得到了1059个疾病分子互作关系对。通过对36个突变基因进行GO生物学过程分析可知,突变基因的功能集中在骨骼系统的发育和形态学变化等方面。结论:首先,我们筛选到与腰椎间盘退变性疾病相关的差异表达基因。这些差异表达基因的筛选结果为进一步研究腰椎间盘退变性疾病相关的分子机制提供了基础。这些发现也为进一步改进腰椎间盘退变性疾病在临床上的治疗提供了可能性。此外,通过生物信息学方法筛选到差异共表达基因,并构建差异共表达基因的调控网络,识别出与腰椎间盘退变性疾病相应的靶基因和生物通路。最后,通过文本分析,识别与腰椎间盘退变性疾病相关表型和基因,构建疾病相关基因的互作组网络,并对基因的互作网络进行功能分析。总之,本文通过差异表达基因的筛选和差异共表达基因的分析,进而结合文本挖掘技术对腰椎间盘退变性疾病相关的分子和通路进行分析,筛选到在疾病发生过程中起着重要作用的基因及通路,这些基因和通路的分析为今后进一步研究腰椎间盘退变性疾病的发生发展过程提供了很好的研究方向,也为今后此类疾病的治疗指明了用药作用靶点。今后的研究,我们将结合实验学的手段对我们筛选的基因和通路做更深入的分析,进一步阐明相关的疾病发生机制。