论文部分内容阅读
乳腺癌是发生在乳腺上皮组织的恶性肿瘤,近年来其发病率逐渐上升并且呈现年轻化趋势,已成为威胁女性身体健康的重要疾病之一。乳腺癌的发生发展是多基因参与和多因素作用的复杂生物过程。目前,限制乳腺癌治疗效果的一个关键因素就是不完全清楚其分子机制。因此,对乳腺癌分子机制的深入研究成为提高诊断与治疗效果的一种有效途径。传统生物学主要以细胞内单个小分子的特点和功能为研究重点,尽管该方法可以揭示一些生命机制,但不可否认的是其忽略了细胞内分子间相互作用的生物学特点,无法探索生物复杂的生理生命活动。随着图论的发展,网络为系统研究疾病机制提供了重要依据。加权基因共表达网络(Weight gene co-expression network analysis,WGCNA)是以基因间表达相似性为基础实现网络构建的常用算法。本文将其应用于乳腺癌的基因表达谱数据。本文将TCGA数据库中乳腺癌的基因表达数据作为数据来源。首先利用edgeR算法,从单基因水平进行差异基因分析,共筛选出9,376个与乳腺癌发生发展有关的差异基因。然后运用WGCNA算法对正常样本和乳腺癌样本分别构建基因共表达网络。由于该算法仅将表达具有相似性的基因聚到一个模块,每个模块的差异变化、涉及的生物学意义和模块内基因间的差异共表达情况仍然是未知的。因此,本文着重对模块进行差异分析。通过模块差异关联分析、模块功能富集分析和差异基因相关性分析的方法,整合出每个模块的枢纽基因及其富集的生物过程。最后通过分析药物信号与枢纽基因之间的关系,找到两个可能用于乳腺癌治疗的候选药物 astressin 和 protirelin。