论文部分内容阅读
目的分析第二原发结直肠癌(Second primary colorectal cancer,SPCRC)的临床特征,运用竞争风险理念识别预后危险因素,构建肿瘤相关死亡预测模型,并评估其临床应用价值。方法本回顾性研究数据来自1988-2013年美国国立癌症研究所SEER(The Surveillance,Epidemiology,and End Results)数据库。共纳入4381例符合标准的第二原发结直肠癌患者,采用标准化发病率(Standardized incidence ratios,SIR)描述其相对风险,年度变化百分比(Annual percentage change,APC)描述发病趋势。运用竞争风险理念(Competing-risk methodology),将非肿瘤相关死亡作为竞争事件,通过计算肿瘤相关死亡的累积发生函数(Cumulative Incidence Function,CIF)进行单因素分析,将有统计学差异的变量纳入多因素分析。在多因素分析中构建部分分布比例风险回归(Proportional subdistribution hazard regression)分析,将有意义变量纳入Lasso回归进一步压缩变量,构建竞争风险列线图,预测1年、3年、5年的肿瘤相关死亡概率。最后进行模型的内部验证及外部验证,采用受试者工作曲线(Receiver operator characteristic curve,ROC)和校准图(Calibrationplot)评价模型的性能,评估其临床应用价值。结果经过筛选,最终纳入4381例患者进行研究,中位随访时间为94个月。所有患者中有2631例患者随访结局为死亡,其中肿瘤相关死亡1641例,非肿瘤相关死亡990例。肿瘤相关死亡的5年累积发生率为38.692%,95%置信区间(Confidence interval,CI)为38.686%-38.700%,非肿瘤相关死亡5年累积发生率为15.441%,95%置信区间(Confidence interval,CI)为15.437%-15.445%。研究发现第二原发结直肠癌发病率逐渐升高,发病间隔时间≤60个月、首发肿瘤位于左半结肠、女性患者发生第二原发结直肠的风险增加。首发结直肠癌的肿瘤部位、TNM分期和第二原发结直肠癌的发病间隔时间、性别、种族、婚姻状态、肿瘤部位、Grade分级、TNM分期、手术情况、CEA水平是第二原发结直肠癌特异性死亡的独立预测因素。经过Lasso回归(Least absolute shrinkage and selection operator regression)压缩变量,最终首发结直肠癌(Initial colorectal cancer,ICRC)的TNM分期和第二原发结直肠癌的发病间隔时间、性别、肿瘤部位、Grade分级、TNM分期、手术情况、CEA水平8个协变量纳入模型的构建,并以列线图的形式呈现。内部验证显示模型的ROC曲线下面积(Area under curve,AUC)为0.792(95%CI 0.782-0.810),并且校准图表现良好。外部验证显示模型的AUC为0.787(95%CI 0.712-0.801),同时校准图也表现良好。通过内部验证及外部验证,可见模型显示出了良好的性能。结论第二原发结直肠癌发病率呈上升趋势,发病间隔时间≤60个月、首发肿瘤位于左半结肠、女性患者发生第二原发结直肠的风险增加,且预后要差于单发结直肠癌患者。本研究依靠大数据及竞争风险理念,建立了第二原发结直肠癌肿瘤相关死亡预测模型,并将该模型以列线图的形式呈现,内部验证显示模型性能良好。外部验证,再次证明该可视化的模型实现了对第二原发结直肠癌患者肿瘤相关死亡可能的个体化预测,有临床应用价值。