论文部分内容阅读
背景:
结直肠癌是威胁生命健康和引发社会疾病负担的重要恶性肿瘤之一,其发病率和死亡率分别位列我国主要癌症中的第三位和第五位,且发病率和死亡率逐年上升。由于缺乏全国性的结直肠癌筛查,大多数患者在诊断时疾病已经进展到中晚期,患者的五年生存率不足50%,而如果在结直肠癌早期就可以得到诊断与及时治疗,生存率可以大大提高到90%左右。因此结直肠癌的早期发现、早期诊断与治疗非常重要。国内外学者已尝试建立多种结直肠癌风险预测模型用于识别危险因素、筛选高危人群及评估发病风险,从而为不同风险人群提供个性化的筛查方案。然而,各模型的建立和验证多基于本地区人群,是否适用于外部人群尚待验证。因此,探究结直肠癌危险因素,构建高效易行的结直肠癌风险预测模型,对人群进行风险分层和个体风险预测,精准开展结直肠癌预防与控制工作,这对于降低结直肠癌负担,具有较强的公共卫生意义。
目的:
在中国大规模人群队列研究基础上,建立高效易行的中国人群结直肠癌风险预测模型,并在人群结直肠癌筛查队列中进行前瞻性验证,结合现有成熟筛查技术,确立较优化人群筛查方案。
方法:
1.结直肠癌风险预测模型构建及内部验证
(1)基于开滦队列(2006-2015年)人群每两年一次的问卷调查和健康体检,收集基线调查时人口学信息、生活方式信息、身高、体重、腰围等身体测量指标信息及结直肠癌发病结局资料。此外,采用被动随访(相关数据库链接)补充收集随访过程中可能遗漏的结直肠癌新发病例。
(2)经随机抽样按照1∶1比例将该数据集分为训练集和验证集(各36403人)。在训练集将候选因素纳入多因素logistic回归中,并采用逐步回归分析法(P<0.20为选入标准),识别结直肠癌独立预测因素。通过将回归方程中的β系数乘以3并四舍五入取整数,转换为相应的得分,从而建立结直肠癌风险预测模型。模型拟合优度采用Hosmer-lemeshow方法检验,并采用非参数Bootstrap方法和K折交叉验证进行验证。
(3)依据每位研究对象患结直肠癌的危险分值,绘制受试者工作特征(Receiver Operating Characteristic,ROC)曲线,并计算曲线下面积(Area Under Curve,AUC)和95%可信区间(95% CI)。根据ROC曲线确立最优化截断值,将研究对象患结直肠癌的风险划分为低风险组和高风险组,然后计算结直肠癌风险预测模型的灵敏度、特异度、约登指数等指标。
2.结直肠癌风险预测模型外部验证及应用价值评价
(1)基于目前正在开展的一项多中心结直肠癌筛查队列(Target-C研究)基线数据。使用结直肠癌风险预测模型,计算个体风险得分,并同时进行结肠镜检查和免疫法粪便隐血试验(Fecal Immunochemical Testing,FIT)检测。采用多因素logistic回归模型纳入评价影响结肠镜筛查参与率的因素,计算相应因素的比值比(Odds Ratio,OR)及95%CI。
(2)以进展期肿瘤(结直肠癌和进展期腺瘤)为终点,绘制对应的ROC,并计算结直肠癌风险预测模型和FIT的AUC及其95%CI。进一步评估二者单独检测以及联合检测的诊断效能,诊断效能以敏感度、特异度、约登指数等指标进行评价。
结果:
1.结直肠癌风险预测模型构建及内部验证
(1)在9年的随访中,收集378例结直肠癌新发病例。经过变量筛选和模型优化,在训练集所建立的结直肠癌风险预测模型由年龄、饮酒情况和糖尿病史3个变量组成,分值范围为0~7分,预测的一致性好(P=0.860),区分能力一般(AUC为0.625,95%CI=0.586-0.665),但明显优于其他类似预测模型(P<0.05)。以3分作为筛查界值,高风险组的人群患结直肠癌的风险是低风险组的2.04倍(95%CI=1.52-2.74),其敏感度、特异度和约登指数分别为56.04%、61.59%和0.18。
(2)根据训练集建立的结直肠癌风险预测模型,对验证集每个研究对象计算结直肠癌发病危险分值,预测的一致性好(P=0.571),区分能力有所下降(AUC为0.578,95%CI=0.539-0.618)。以3分作为筛查界值,高风险组的人群患结直肠癌的风险是低风险组的1.60倍(95%CI=1.21-2.11),其敏感度、特异度和约登指数分别为51.02%、60.52%和0.12。
2.结直肠癌风险预测模型外部验证及应用价值评价
(1)共有3723人符合纳入条件并进行了问卷调查,其中完成结肠镜检查1665人,参与率为44.72%。多因素logistic回归模型分析,发现年龄、受教育程度、饮酒状况和高血压史与结肠镜筛查的参与率有关。
(2)分别检出结直肠癌、进展期腺瘤、非进展期腺瘤、进展期肿瘤和任何肿瘤9例、85例、312例、94例和406例,检出率分别为0.54%、5.11%、18.74%、5.65%和24.38%。男性检出率高于女性,且除结直肠癌外,进展期腺瘤、非进展期腺瘤、进展期肿瘤和任何肿瘤检出率均显示随年龄增加而增加。
(3)根据训练集建立的结直肠癌风险预测模型,对外部验证集每个研究对象计算结直肠进展期肿瘤发病危险分值,AUC为0.582。以3分作为筛查界值,高风险组的人群发生进展期肿瘤的风险是低风险组的1.70倍(95%CI=1.12-2.57),其敏感度、特异度和约登指数分别为50.00%、62.89%和0.13,此时每检出1例进展期肿瘤患者需要13.40人行结肠镜检查。如果仅对高风险人群进行结肠镜筛查,则在减少62%结肠镜检查例数的情况下,可以筛查出50%的进展期肿瘤病例。
(4)当把结直肠癌风险预测模型与FIT进行并联(即结直肠癌风险评分≥3或者FIT值≥100μgHb/g被判断为结直肠病变发病高风险人群)时,高风险组的人群发生进展期肿瘤的风险是低风险组的2.01倍(95%CI=1.29-3.13),与单独使用FIT相比,并联后对进展期肿瘤的灵敏度由9.52%提高到54.76%,此时每检出1例进展期肿瘤患者需要12.61人行结肠镜检查。如果仅对高风险人群进行结肠镜筛查,则在减少61%结肠镜检查例数的情况下,可以筛查出55%的进展期肿瘤病例。
结论:
本研究探讨了结直肠癌的潜在危险因素,建立了基于一项前瞻性队列研究的结直肠癌风险预测模型并在筛查人群中进行了验证。结果表明基于年龄、饮酒情况和糖尿病史构建的结直肠癌风险预测模型是确定无症状人群进展期肿瘤风险的有用工具。联合FIT对于无症状人群结直肠病变发生风险的预测准确度较高,可以大大减少结肠镜检查的工作量,这对于高效开展结直肠癌筛查和预防工作,降低其发病率和疾病负担具有重要的意义。受人群动员和筛查参与率的影响,结直肠癌风险预测模型与FIT组合筛查的有效性和准确性应当在未来更大规模人群筛查项目中进行进一步验证。
结直肠癌是威胁生命健康和引发社会疾病负担的重要恶性肿瘤之一,其发病率和死亡率分别位列我国主要癌症中的第三位和第五位,且发病率和死亡率逐年上升。由于缺乏全国性的结直肠癌筛查,大多数患者在诊断时疾病已经进展到中晚期,患者的五年生存率不足50%,而如果在结直肠癌早期就可以得到诊断与及时治疗,生存率可以大大提高到90%左右。因此结直肠癌的早期发现、早期诊断与治疗非常重要。国内外学者已尝试建立多种结直肠癌风险预测模型用于识别危险因素、筛选高危人群及评估发病风险,从而为不同风险人群提供个性化的筛查方案。然而,各模型的建立和验证多基于本地区人群,是否适用于外部人群尚待验证。因此,探究结直肠癌危险因素,构建高效易行的结直肠癌风险预测模型,对人群进行风险分层和个体风险预测,精准开展结直肠癌预防与控制工作,这对于降低结直肠癌负担,具有较强的公共卫生意义。
目的:
在中国大规模人群队列研究基础上,建立高效易行的中国人群结直肠癌风险预测模型,并在人群结直肠癌筛查队列中进行前瞻性验证,结合现有成熟筛查技术,确立较优化人群筛查方案。
方法:
1.结直肠癌风险预测模型构建及内部验证
(1)基于开滦队列(2006-2015年)人群每两年一次的问卷调查和健康体检,收集基线调查时人口学信息、生活方式信息、身高、体重、腰围等身体测量指标信息及结直肠癌发病结局资料。此外,采用被动随访(相关数据库链接)补充收集随访过程中可能遗漏的结直肠癌新发病例。
(2)经随机抽样按照1∶1比例将该数据集分为训练集和验证集(各36403人)。在训练集将候选因素纳入多因素logistic回归中,并采用逐步回归分析法(P<0.20为选入标准),识别结直肠癌独立预测因素。通过将回归方程中的β系数乘以3并四舍五入取整数,转换为相应的得分,从而建立结直肠癌风险预测模型。模型拟合优度采用Hosmer-lemeshow方法检验,并采用非参数Bootstrap方法和K折交叉验证进行验证。
(3)依据每位研究对象患结直肠癌的危险分值,绘制受试者工作特征(Receiver Operating Characteristic,ROC)曲线,并计算曲线下面积(Area Under Curve,AUC)和95%可信区间(95% CI)。根据ROC曲线确立最优化截断值,将研究对象患结直肠癌的风险划分为低风险组和高风险组,然后计算结直肠癌风险预测模型的灵敏度、特异度、约登指数等指标。
2.结直肠癌风险预测模型外部验证及应用价值评价
(1)基于目前正在开展的一项多中心结直肠癌筛查队列(Target-C研究)基线数据。使用结直肠癌风险预测模型,计算个体风险得分,并同时进行结肠镜检查和免疫法粪便隐血试验(Fecal Immunochemical Testing,FIT)检测。采用多因素logistic回归模型纳入评价影响结肠镜筛查参与率的因素,计算相应因素的比值比(Odds Ratio,OR)及95%CI。
(2)以进展期肿瘤(结直肠癌和进展期腺瘤)为终点,绘制对应的ROC,并计算结直肠癌风险预测模型和FIT的AUC及其95%CI。进一步评估二者单独检测以及联合检测的诊断效能,诊断效能以敏感度、特异度、约登指数等指标进行评价。
结果:
1.结直肠癌风险预测模型构建及内部验证
(1)在9年的随访中,收集378例结直肠癌新发病例。经过变量筛选和模型优化,在训练集所建立的结直肠癌风险预测模型由年龄、饮酒情况和糖尿病史3个变量组成,分值范围为0~7分,预测的一致性好(P=0.860),区分能力一般(AUC为0.625,95%CI=0.586-0.665),但明显优于其他类似预测模型(P<0.05)。以3分作为筛查界值,高风险组的人群患结直肠癌的风险是低风险组的2.04倍(95%CI=1.52-2.74),其敏感度、特异度和约登指数分别为56.04%、61.59%和0.18。
(2)根据训练集建立的结直肠癌风险预测模型,对验证集每个研究对象计算结直肠癌发病危险分值,预测的一致性好(P=0.571),区分能力有所下降(AUC为0.578,95%CI=0.539-0.618)。以3分作为筛查界值,高风险组的人群患结直肠癌的风险是低风险组的1.60倍(95%CI=1.21-2.11),其敏感度、特异度和约登指数分别为51.02%、60.52%和0.12。
2.结直肠癌风险预测模型外部验证及应用价值评价
(1)共有3723人符合纳入条件并进行了问卷调查,其中完成结肠镜检查1665人,参与率为44.72%。多因素logistic回归模型分析,发现年龄、受教育程度、饮酒状况和高血压史与结肠镜筛查的参与率有关。
(2)分别检出结直肠癌、进展期腺瘤、非进展期腺瘤、进展期肿瘤和任何肿瘤9例、85例、312例、94例和406例,检出率分别为0.54%、5.11%、18.74%、5.65%和24.38%。男性检出率高于女性,且除结直肠癌外,进展期腺瘤、非进展期腺瘤、进展期肿瘤和任何肿瘤检出率均显示随年龄增加而增加。
(3)根据训练集建立的结直肠癌风险预测模型,对外部验证集每个研究对象计算结直肠进展期肿瘤发病危险分值,AUC为0.582。以3分作为筛查界值,高风险组的人群发生进展期肿瘤的风险是低风险组的1.70倍(95%CI=1.12-2.57),其敏感度、特异度和约登指数分别为50.00%、62.89%和0.13,此时每检出1例进展期肿瘤患者需要13.40人行结肠镜检查。如果仅对高风险人群进行结肠镜筛查,则在减少62%结肠镜检查例数的情况下,可以筛查出50%的进展期肿瘤病例。
(4)当把结直肠癌风险预测模型与FIT进行并联(即结直肠癌风险评分≥3或者FIT值≥100μgHb/g被判断为结直肠病变发病高风险人群)时,高风险组的人群发生进展期肿瘤的风险是低风险组的2.01倍(95%CI=1.29-3.13),与单独使用FIT相比,并联后对进展期肿瘤的灵敏度由9.52%提高到54.76%,此时每检出1例进展期肿瘤患者需要12.61人行结肠镜检查。如果仅对高风险人群进行结肠镜筛查,则在减少61%结肠镜检查例数的情况下,可以筛查出55%的进展期肿瘤病例。
结论:
本研究探讨了结直肠癌的潜在危险因素,建立了基于一项前瞻性队列研究的结直肠癌风险预测模型并在筛查人群中进行了验证。结果表明基于年龄、饮酒情况和糖尿病史构建的结直肠癌风险预测模型是确定无症状人群进展期肿瘤风险的有用工具。联合FIT对于无症状人群结直肠病变发生风险的预测准确度较高,可以大大减少结肠镜检查的工作量,这对于高效开展结直肠癌筛查和预防工作,降低其发病率和疾病负担具有重要的意义。受人群动员和筛查参与率的影响,结直肠癌风险预测模型与FIT组合筛查的有效性和准确性应当在未来更大规模人群筛查项目中进行进一步验证。