论文部分内容阅读
在临床实践中,乳腺癌通常分为雌激素受体(Estrogen Receptor. ER)阳性(ER阳性,ER+)和ER阴性两种亚型。这两种亚型对术后辅助治疗药物的敏感性不同,例如ER阳性乳腺癌患者对内分泌治疗药物他莫昔芬(Tamoxifen)敏感,ER阴性患者则不敏感。一些研究已经识别了这两种亚型之间的差异表达基因并开发了几个用于预测ER阳性乳腺癌患者对他莫昔芬敏感性的预测器。但是,这些预测器的预测能力经常在不同实验室获取的独立样本中急剧下降。因此,本论文的主要研究目的是构建一个准确而且稳健的、用于预测ER阳性乳腺癌患者对他莫昔芬治疗敏感性的预测器。首先,利用一个包含519个乳腺癌样本和63个正常对照样本的基因表达谱数据集,本文把ER阳性和ER阴性乳腺癌表达谱相对于正常表达谱共同失调的基因分为两类:(1)在这两种亚型中失调方向相同但失调程度不同的基因:(2)在这两种亚型中失调方向相反的基因。这两类基因在一个包含281个乳腺癌样本和49个正常对照样本的RNA测序表达谱数据集中得到了验证。在ER阳性和ER阴性乳腺癌中失调程度较大的基因分别富集于糖类脂类代谢和细胞增殖相关的生物学过程中。另一方面,在这两种亚型中失调方向相反的基因富集了已知的癌基因且倾向于与已知的癌基因编码的蛋白质相互作用,并且这些基因通过使不同的子通路失调分别参与ER阳性和ER阴性乳腺癌的致癌过程。尽管这两种亚型的基因表达谱存在广泛的差异,但是部分ER阳性乳腺癌患者的基因表达谱具有ER阴性乳腺癌的表达特征,这提示可以基于基因表达谱预测ER阳性乳腺癌患者对其主要辅助治疗药物他莫昔芬的敏感性。然后,利用一个包含420个正常对照和1129个ER阳性乳腺癌样本的整合数据集,本文识别了其表达相对秩序在正常对照样本中高度稳定但在ER阳性乳腺癌样本中显著逆转的基因对。利用292个接受5年他莫昔芬辅助治疗的ER阳性乳腺癌患者的基因表达谱样本,本文从这些基因对中识别了其表达相对秩序与他莫昔芬治疗的ER阳性乳腺癌患者的复发风险显著相关的基因对。基于一个分类规则——基因对的表达相对秩序发生显著逆转的患者对他莫昔芬不敏感,本文使用遗传算法提取了一个预测ER阳性乳腺癌患者对他莫昔芬敏感性的最优特征子集。利用这个特征子集中的基因对,本文采用上文的分类规则构建了一个用于预测ER阳性乳腺癌患者对他莫昔芬敏感性的预测器。这个预测器的预测性能在2个分别包含250和248个接受5年他莫昔芬辅助治疗的ER阳性乳腺癌患者的验证群体(每个群体来源于多个癌症中心)中得到了验证。在第一个验证群体中,被预测为对他莫昔芬敏感的ER阳性乳腺癌患者的10年无复发生存率为91%(95%CI(Confidence Interval,置信区间),85%-97%),其绝对风险降低率是34%(95% CI,17%-51%);被预测为对他莫昔芬不敏感的ER阳性乳腺癌患者的10年复发率为43%,其复发风险显著高于被预测为对他莫昔芬敏感的患者(风险比为4.99,95% CI,2.45-10.17;P=9.13×10-7)。预测器在第二个验证群体中和第一个验证群体中具有相似的预测性能。当校正了传统的临床病理学参数后,本预测器的预测结果仍然与患者的复发风险显著相关,而且其在腋下淋巴结阴性和阳性患者子集中都有很好的预测能力。此外,本预测器对技术重复样本的预测结果具有很高的一致性。相比之下,本文构建的预测器在两个验证群体中的预测性能和对技术重复样本分类的一致性都优于以前提出的两个基于基因绝对表达值的预测器。综上所述,本文研究了ER阳性和ER阴性乳腺癌相对于正常对照共同失调的基因,并基于基因表达相对秩序构建了一个预测ER阳性乳腺癌患者对他莫昔芬敏感性的预测器。这个预测器能够准确而且稳定地预测独立跨实验室的ER阳性乳腺癌患者对他莫昔芬的敏感性,也可以识别那些在接受他莫昔芬辅助治疗后10年无复发生存率高的患者。