论文部分内容阅读
疾病,特别是复杂疾病,严重影响着人类的身体健康以及正常生活。而癌症作为一种对人类健康具有严重损害的复杂疾病,长久以来一直受到研究者的广泛关注。随着后基因组时代的来临以及测序技术的飞速发展,生物测序数据的数量不断增加,越来越多的公共数据可以供研究者使用,如TCGA数据库,OMIM数据库以及GEO数据库等等。这些测序数据的开放使得整合多种生物数据,在分子水平上研究癌症的潜在机制及其致病原理变成人类疾病研究的一个重要方向。另一方面,疾病的发展是一个动态变化的生物过程,疾病会随着时间推移不断发生变化。这一认识使得动态分子网络上复杂疾病的分析受到了更多的关注。动态分子网络上疾病的演化分析从微观上可以了解基因和蛋白质的功能,探究生物通路的变化以及判断细胞的状态,从宏观上可以帮助揭示疾病发生机制,判定药物疗效以及制定个性化治疗方案。不同于以往静态网络或动态网络上生物标记的识别,本文旨在从动态发展的角度以及不同的粒度来分析癌症的发展变化。文章通过整合多种生物数据,从分子层面构建了肺癌疾病三个阶段的动态网络,并在动态网络上从多个粒度进行了疾病的演化分析。文章通过整合蛋白质相互作用网络数据和基因分子表达水平的微阵列数据以及肺癌发展过程中的阶段划分信息,构建了肺癌发展的三个阶段的基因分子网络,然后利用马尔科夫聚类方法识别各阶段的疾病网络上的功能,构建了一个加权的多部图来模拟网络演化过程。接着,分别从单个重要基因,生物通路和模块标记三个方面来分析肺癌在三个阶段的疾病分子网络上的变化,包括网络规模的变化,网络中基因的度分布以及聚集系数分布,网络中与疾病相关的生物通路,网络中模块数量的变化以及模块在疾病发展过程中的演化事件分析。最后,根据网络中基因与已知致病基因的连接关系结合动态网络中癌症的演化规律,对相关基因进行打分排序及筛选,进行致病基因的预测并从统计学意义和生物意等多个方面进行了候选致病基因的验证分析。在利用PPI数据和肺癌微阵列数据(ID:GDS3257)构建的疾病分子网络上进行的动态演化分析表明,文中的网络构建方法可以较好的构建出肺癌的疾病分子网络,反映出基因之间的相互作用关系。疾病网络上的动态演化分析能够从分子水平解释肺癌发展过程中基因的重要变化,并能够识别肺癌发展过程中相关的生物模块和生物通路。候选基因的预测以及对候选基因的验证分析说明我们预测的致病基因并非随机生成的,并且具有一定的可靠性,可以作为较强的生物标记。