论文部分内容阅读
乳腺癌是妇女常见的恶性肿瘤,在我国其发病率正逐年上升。尽管近年来乳腺癌的诊疗水平得到了长足的进步,但其现状仍远不能令人满意。早期诊断是提高乳腺癌患者生存率的最合理途径。因此,寻找灵敏、特异、检测方便的新肿瘤标志物成为目前研究的热点。表面增强激光解吸电离——飞行时间质谱仪(surface enhanced laserdesorption/ionization time-of-flight mass spectrometry,SELDI-TOF-MS)是近年来发展起来的一种全新的蛋白质组学研究手段,它是一种基于质谱技术和蛋白质芯片技术相结合的研究方法,该技术可同时找到多个蛋白质标志物,为探索肿瘤标志物的研究提供了新的技术平台。目的:应用SELDI技术和生物信息学方法从血清中筛选乳腺癌蛋白质标志物并构建检测模型,为诊断、术前分期、预测腋淋巴结(axillary lymph nodes,ALN)转移等提供可能的简便易行的方法。方法:应用美国Ciphergen公司的PBSⅡc型蛋白质芯片——时间飞行质谱仪作为蛋白质组学研究平台,采用CM10芯片,对66例乳腺癌患者、49例乳腺良性疾病患者和29例健康人的血清进行了检测,采用Ciphergen公司的Biomarker Wizard软件和BPS 5.0(Biomarker Patterns systems)软件对获得的结果进行分析,寻找三种人群血清中的蛋白质谱差异,并建立决策树分类模型。对34例Ⅰ~Ⅱ期乳腺癌患者和31例Ⅲ~Ⅳ期乳腺癌的血清进行了检测,寻找两组人群血清中的蛋白质谱差异,并建立决策树分类模型。研究了乳腺癌患者血清蛋白质指纹图谱与是否发生ALN转移及其与侵袭ALN数量的关系,并结合生物信息学方法建立了相应的检测模型。结果:1.有13个蛋白质峰表达量在乳腺癌患者和健康人对照组之间有显著性差异(P<0.05),M/Z为M2306.58,M3091.15,M4804.47和M5476.80的4个蛋白质峰被选为分类变量构成决策树分类模型,该模型的交叉验证(测试组)总准确率为74.7%,敏感性为74.2%,特异性为75.9%。2.有22个蛋白质峰的表达量在乳腺癌组与乳腺良性疾病对照组之间有显著性差异(P<0.05),M/Z为M2939.19,M2952.86,M4147.16和M4845.31的4个蛋白质峰被选为分类变量构成决策树分类模型,交叉验证(测试组)总准确率为73.0%,敏感性为74.2%,特异性为71.4%。3.19个蛋白质峰表达量在乳腺癌组与非乳腺癌对照组之间有显著性差异(P<0.05),M/Z为M2306.58、M2952.86、M4102.03、M4147.16和M5333.92的5个蛋白质峰被选为分类变量构成决策树分类模型,交叉验证(测试组)总准确率为77.1%,敏感性为75.8%,特异性为78.2%。这三种分类诊断模型的敏感性和特异性均高于现有的各种肿瘤标志物,具有一定的诊断价值。4.上述三种模型对早期乳腺癌患者的检测能力不亚于对中晚期患者(P>0.05)。5.11个蛋白质峰在两组患者之间表达量有显著性差异(P<0.05),M/Z为M2042.87,M2459.83,M3881.37,M4804.47,M6683.24和M6706.06的6个蛋白质峰被选为分类变量构成决策树分类模型,该模型的交叉验证(测试组)总准确率为80.0%,Ⅰ~Ⅱ期乳腺癌检出率为82.4%,Ⅲ~Ⅳ期检出率为77.4%。6.通过对ALN有/无转移的乳腺癌患者血清蛋白指纹图谱数据的比较,找到了11个差异蛋白质峰(P<0.05),M/Z为M2164.16,M3269.90和M3272.31的3个蛋白质峰被选择用于构建分类决策树模型,该模型的交叉验证(测试组)总准确率为81.8%,ALN有转移的乳腺癌患者检出率为83.3%,ALN无转移的检出率为80%。7.有13个蛋白质峰表达量在受累ALN≤3个和受累ALN>3个患者之间有显著性差异(P<0.05)。M/Z为M2414.20、M2727.38、M2772.35、M2949.77和M3155.80的5个蛋白质峰被用于构建分类决策树模型,该模型交叉验证(测试组)总准确率为86.1%,受累ALN≤3个的乳腺癌患者的检出率为82.4%(14/17),受累ALN>3个的乳腺癌患者的检出率为89.5%。结论:1.M2306.58,M3091.15,M4804.47和M5476.80的4个蛋白质峰构成的决策树分类模型能达到区分乳腺癌患者和健康人的最佳效果,该模型的总准确率为74.7%,对不同分期乳腺癌患者均具有相似的检测效力。2.M2939.19,M2952.86,M4147.16和M4845.31的4个蛋白质峰构成的决策树分类模型能达到区分乳腺癌患者与乳腺良性疾病患者的最佳效果,该模型的总准确率为73.0%,对不同分期乳腺癌患者均具有相似的检测效力。3.M2306.58、M2952.86、M4102.03、M4147.16和M5333.92的5个蛋白质峰构成的决策树分类模型能达到区分乳腺癌患者与非乳腺癌对照人群的最佳效果,该模型的总准确率为77.1%,对不同分期乳腺癌患者均具有相似的检测效力。4.M2042.87,M2459.83,M3881.37,M4804.47,M6683.24和M6706.06的6个蛋白质峰构成的决策树分类模型能达到区分Ⅰ~Ⅱ期和Ⅲ~Ⅳ期乳腺癌患者的最佳效果,该模型的总准确率为80.0%,提示该判别模型可在术前估计病理分级,对术前分级的判断具有很好的应用价值。5.M/Z为M2164.16,M3269.90和M3272.31的3个蛋白质峰构建的分类决策树模型能达到区分ALN是否有转移的最佳效果,该模型的总准确率为81.8%。6.M/Z为M2414.20、M2727.38、M2772.35、M2949.77和M3155.80的5个蛋白质峰构建的分类决策树模型能够达到预测ALN转移数量是否>3个的效果,该模型的总准确率为86.1%。