论文部分内容阅读
生物体内需要经过多种中间反应从营养物质转化成最终代谢产物。转化过程中,代谢反应过程却是错综复杂、多种途径并存的。从一个抽象的水平上看,细胞代谢可以被看成一个连接各个节点(物质)的复杂网络,生物体功能通过网状的交互作用完成。代谢网络是生物系统中最重要的网络之一,它连接着基因型和表现型。理解、分析代谢网络的功能是当前生物信息和系统生物学的重要组成部分。不仅要对单个代谢物深入研究,也必然需要将大量数据整合起来进行分析,以系统的观点研究生物网络的组织结构。本文针对代谢网络的若干计算问题进行研究。论文主要从以下几个方向深入研究:
1.理解代谢网络内部流量分布,特别是基因敲除后的流量分布有助于设计菌株。然而代谢流量平衡分布计算是一个开放性问题,一直没有一个较好的求解,存在理论期望值和化合物测量值之间的差异。本文提出了一个新的模型用于计算代谢流量分布,分析结果具有指导意义。
2.代谢网络具有很多冗余路径,并不是每一个反应都是重要的。尽管也出现了一些方法(包括代谢平衡分析方法)用于预测基因重要性,但是还不通用,所需条件很多,只能针对特定的模式生物有效。通过“反应—酶—基因”的关系。由反应重要性推测出基因重要性,发现可以从以下三个方面深入研究:(1)模拟生物体生长所需最小代谢网络,给出网络中的重要反应;(2)通过模拟代谢网络中的某一个反应被删除后对其他反应的影响程度,预测该反应重要性:(3)通过某一个反应在所有生物体中是否存在,给出一个权重,再预测这些反应的重要性。生物实验是通过一个一个敲除基因观察该生物是否生长来推测该基因是否重要,要对每一个基因都做生物实验的工作量是极其巨大的。而使用本文所提出这些方法将会大大降低难度和复杂度。
3.模拟代谢反应的缺失变异对整个网络的影响程度。影响程度定义为级联影响被删除反应前后的反应个数。每一个生物体的平均反应影响程度都很小,这就显示冗余的代谢路径能够补偿反应的缺失。发现古菌的平均反应影响程度小于真核生物和细菌,这可能暗示着古菌具有很强的健壮性抵制了进化过程中的扰动。同时,发现代谢网络的无尺度特性和反应的可逆性决定了代谢网络的健壮性。还发现生物体适宜的生长温度和代谢网络结构存在一些相关性。
4.提出了一个代谢网络的进化模型,这个模型阐明了从少数远古时期的物质进化发展到当前复杂的代谢反应网络。这个模型是基于两个重要条件的:反应的分布权重和代谢物的连接性。发现存在于很多种生物体中的反应是重要的,因为重要反应一般比非重要反应进化出现得早,所以这种分布广的反应就应该比分布窄的出现得早。此外,进化过程巾,后出现的反应的反应物必须早已出现。在给定的一些原始地球可能出现的有机物和无机物基础上,描绘了代谢网络的进化过程。在这个模型基础上,做了进一步分析:首先,分析生物进化过程中氧气怎么出现以及推测出现的时间段;其次,研究了生物体进化过程中的适应性和自主性;最后,评估优化生长的反应是否出现在进化早期。