论文部分内容阅读
疾病影响着人类的正常生活和工作,以癌症为代表的复杂疾病更是严重威胁着人类的生命安全。虽然针对复杂疾病的治疗方法和药物研究已取得一定的成效,但是对复杂疾病的认识不够深入,因而制约着更有效的诊疗方法出现。随着生命科学的发展,高通量测序技术引发后基因组时代的到来,各种不同组学的数据大量涌现,疾病生物标记的研究进入了一个新时代。同类复杂疾病在病因、症状等方面有许多共同之处,这与它们相似的分子基础有关,比如BCL2和ERBB2等基因与多种癌症的发生相关。这为研究多种同类复杂疾病的机理提供了可能,同类型的疾病是否存在共同的致病基因?是否存在共同的生物标记?与现有的针对特定疾病生物标记识别研究不同,本文研究同类复杂疾病的生物标记识别问题。目前识别生物标记的方法多集中于研究表达差异的基因,而忽视了生物分子间调控或相互作用关系的变化。然而,这种变化与疾病的发生有着重要的联系。比如基因MDK通过激活PI3K代谢路径加速癌症的发展,金雀异黄酮对基因CD44表达的负调控作用可以抑制癌症的发生。因此,相比为疾病识别相关的单个基因,系统地识别与疾病相关的基因模块,并将其作为生物标记显得更为重要。在疾病样本和正常样本下分别构建基因网络,基于这两个网络间差异的基因作用关系更可能与疾病相关的假设,通过集成基因表达数据和蛋白质相互作用网络数据,将差异网络应用到复杂疾病生物标记识别问题上。针对癌症这类复杂疾病的实验研究成功识别出由19个基因和它们之间17条作用关系组成的基因模块。从统计方法、生物意义和分类器模型角度对实验结果进行验证,结果表明该基因模块在癌症的发生和发展过程中起重要作用,同时也说明本文基于差异网络的方法是一种有效、通用的同类复杂疾病生物标记识别方法。