论文部分内容阅读
三阴性乳腺癌(TNBC)(Triple Negative Breast Cancer, TNBC)是指雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体(HER2)均为阴性的一种特殊类型乳腺癌。由于三阴性乳腺癌(TNBC)的发病年龄较其他亚型乳腺癌早,且发生内脏转移的概率高,目前还没有有效的定向治疗,化疗是唯一的全身治疗手段。以蒽环类为基础的新辅助化疗是目前最为流行、应用最普遍且疗效较好的乳腺癌治疗方案,并在治疗三阴性乳腺癌(TNBC)上取得了重大突破。但是由于频繁的药物敏感性和抵抗性,发现少部分三阴性乳腺癌(TNBC)患者对蒽环霉素具有敏感性,影响了TNBC的治疗。如果能提前预测三阴性乳腺癌(TNBC)患者是否对蒽环类有敏感性,在一定程度上能提高TNBC的治愈率。本文的主要内容是在基于高通量-DNA微阵列技术方法得到的基因表达矩阵基础上,应用特征选择方法选取出三阴性乳腺癌(TNBC)患者对蒽环霉素具有敏感性的基因,希望选取出来的基因可以准确预测出三阴性乳腺癌患者是否对蒽环霉素过敏,减少由于敏感性而治疗效果不佳的情况。本文用到的主要算法是主成分分析(PCA)和FLD算法,并分别对两个算法进行改进,以提高最优特征子集预测三阴性乳腺癌患者对蒽环霉素过敏的准确率,同时希望选取出的最优特征子集的特征数目较少,算法运行时间也较短。本文的主要内容有如下几点:1、首先了解三阴性乳腺癌(TNBC)的研究现状及基本的治疗方案,提出预测三阴性乳腺癌(TNBC)对蒽环霉素的敏感性,以提高三阴性乳腺癌(TNBC)治疗成功率;2、介绍特征选择技术的基本过程及本文用到的分类器,为下文的特征选择算法改进和在三阴性乳腺癌(TNBC)基因选择的应用做准备;3、分别在深刻理解主成分分析(PCA)和FLD算法的基础上,对两个算法分别进行改进,并应用SPECTF和ionosphere数据集验证改进的算法是否达到我们要求的效果;4、分别应用改进后的算法选取三阴性乳腺癌的基因,并用选取出来的最优特征子集预测三阴性乳腺癌(TNBC)对蒽环霉素的敏感性,通过仿真实验,分析实验结果,总结实验结论;