论文部分内容阅读
目的:根据近年来几项大型临床试验结果,前哨淋巴结活检术已逐步取代常规的腋窝淋巴结清扫手术,成为早期乳腺癌患者的常规手术方式。然而前哨淋巴结活检术仍会带来一些的并发症,虽然发病率低但不应该被忽略。因此,多个研究中心设计并使用数学模型在术前预测前哨淋巴结的病理状态,然而各个国家和地区的患者信息、手术方式、病理检测等因素都或多或少存在差异,所以各研究中心所纳入的预测变量也不尽相同。我们的目的是根据早期乳腺癌患者的临床及病理特点,使用新的算法来建立一种可以被广泛利用且具有较高精度的前哨淋巴结转移预测模型,并探究其临床运用前景。方法:回顾性分析2011年1月至2014年12月接受前哨淋巴结(SLN)检查的633例乳腺癌患者的临床病理资料。由于乳腺癌自然发病率所造成的临床数据资料不平衡,这样会影响算法的准确性,对结果造成偏倚,所以我们使用smote算法对数据进行过采样,以增加数据的平衡量。我们的研究首次将肿瘤的形状和乳腺腺体含量作为一项变量进行分析。同时,由于乳房作为一个立体的器官,我们打破常规的按照象限对肿物所在位置进行分组的方法,而采用向量(肿物的时钟方向及距乳头距离)结合象限法分析肿瘤的原发位置,同时与单纯使用象限分组的方法进行对比分析。通过单因素分析、logistic回归、Smote-Bagged-trees等方法建立预测模型。本次研究使用SPSS 22.0、MATLAB2018a进行数据处理并采用R软件进行了统计分析。第一类错误水平定在0.05。首先采用logistic回归建模,计算模型ROC曲线下面积。再采用Bagged-Tree算法对样本进行分类,通过SMOTE-Bagged Tree算法及五折交叉验证法建立前哨淋巴结转移预测模型。我们通过混淆矩阵和受试者操作特征(ROC)曲线下的面积(AUC)评估该模型的预测能力。结果:对数据集进行单因素及多因素分析,得到了与前哨淋巴结转移相关的4个独立预测因素;通过多因素分析结果,采用logistic回归建立预测模型,建模组的ROC曲线下面积为0.660,模型应用于验证组的ROC曲线下面积为0.580。再采用SMOTE-Bagged Tree法建立前哨淋巴结转移预测模型,包含了以下12个变量:年龄,体重指数(BMI),象限,时钟方向,肿瘤距乳头的距离,肿瘤钼靶的形态,乳腺腺体含量,肿瘤大小,ER,PR,HER2,Ki67。使用bagged tree对样本进行分类。使用五折交叉验证。最后通过向量联合象限分析肿瘤位置,得到的ROC曲线下面积为0.801,通过混淆矩阵计算模型准确率为70.3%。在新算法中,单纯使用向量法对肿瘤位置进行分析,ROC曲线下面积为0.791,模型准确率为70.3%;单纯使用象限方法对肿瘤位置进行分析,ROC曲线下面积为0.701,通过混淆矩阵计算其准确率为63.6%。结论:本模型可以更加可靠、稳定的帮助医生在术前对乳腺癌患者的前哨淋巴结转移情况进行科学预测。对于转移风险低的患者,以及对术后肢体感觉功能的保留有较高要求的患者,在临床上可以考虑免行前哨淋巴结活检术,以提高患者的生活质量。而对于转移风险高的患者,可直接行腋窝处理,如ALND、腋窝放疗等,尤其针对老年或基础状态差的患者,可大幅度缩短手术时间。