论文部分内容阅读
随着人类基因组计划的完成,生物信息学进入了后基因组时代。后基因组时代生物信息学研究的一个主要目的就是探究一个活细胞内所有生物分子和它们之间的相互关系。这些的相互关系构成了错综复杂的生物网络。网络生物学的迅速发展表明,生物网络的组成遵循一个普遍的秩序。当前,生物信息学研究面临的一个主要挑战就是从这些生物网络的拓扑结构中解读出生物功能。网络模体已经证明是一些生物网络中的基本生物功能模块,可以通过网络模体的研究探知生物网络的功能。文中提出了一种基于网络模体相关性分析的预测网络模体功能的思路。首先,本文利用子图分析的方法,分析网络模体的结构独立性,提高网络模体的准确性,有利于网络模体的进一步研究工作。其次,本文在分析当前生物网络研究现状的基础上,基于结构决定功能的生物学假设,以研究网络模体之间的相互关系作为切入点,预测生物网络中的网络模体功能。对于两个节点个数相近的网络模体,本文给出了基于向量空间模型的预测方法,通过比较两个网络模体的相似度,分析它们在功能上的相似性;对于已知功能的节点数较小的网络模体,本文给出了基于统计的预测方法,预测未知功能的节点数较多的网络模体功能。本文以已知功能的网络模体——前反馈回路(FFL)为基础,对大肠杆菌调控网络中包含5个节点的网络模体进行比较和功能预测,利用k-means算法对这些网络模体聚类分析。实验结果表明,我们给出的模型在一定程度上能够预测网络模体的功能。最后,给出了一个网络模体分析系统,系统中首次引入了关联度来判断两个图是否同构,大大提高了系统的运行效率,这对于优化网络模体发现算法也有一定的意义。