论文部分内容阅读
目的:探讨AI技术对超声成像中乳腺肿块的智能化检测与良恶性判定的应用价值,同时求证AI技术是否有助于提高初、中级医师对乳腺肿块良恶性鉴别诊断的水平。方法:回顾性收集2017年6月至2019年4月在大连大学附属中山医院以乳腺肿块为主要就诊原因并经活检、手术病理等证实的患者401例。其中,良性204例(占50.9%),恶性197例(占49.1%),年龄范围18-89岁,平均年龄(48.8±13.9)岁。原始超声图像(包含单幅图像和组合图像共582幅)采集完成后,由AI研究人员先对其预处理,然后由1名主任医师和1名住院医师共同对预处理后得到的697幅图像中所有乳腺肿块进行标注,并随机抽选348幅作为本研究训练集的一部分(训练集中其他超声图像来自于外院),剩余的349幅作为测试集。本研究采用的AI模型是基于深度学习(DL)方法的卷积神经网络(CNN)中经改进的RFBNet模型。接下来1名住院医师(与标注肿块的住院医师为同一位)和1名主治医师分别在无AI预测结果辅助条件下对349幅测试集图像进行诊断,与此同时,AI研究人员用外院提供的3568幅超声图像与本院随机选出的348幅图像共同训练本研究所使用的AI模型,然后用模型检测349幅测试集图像,并得出模型预测的结果。最后,住院医师在有AI预测结果辅助条件下再次对349幅测试集图像进行诊断(根据主治医师独立诊断的结果,其多项参数指标高于AI预测结果,故本研究主治医师未能在AI预测结果辅助条件下再次对349幅测试集图像进行诊断)。本研究数据分析与处理采用SPSS 21.0统计软件。参数指标组间差异比较采用McNemar检验(配对卡方检验)。采用ROC曲线分析AI预测、住院医师独立诊断、住院医师AI辅助下诊断和主治医师独立诊断的效能。以P<0.05为差异具有统计学意义。结果:(1)本研究AI预测真阳性率(TPR)为82.4%,阳性预测值(PPV)为78.4%,假阳性率(FPR)为23.1%,错误发现率(FDR)为21.6%,假阴性率(FNR)为17.6%,阴性预测值(NPV)为81.1%,真阴性率(TNR)为76.9%,错误遗漏率(FOR)为18.9%,平均精度(AP)为79.7%,F0.5-score为79.1%,F1-score为80.3%,F2-score为81.6%,准确率为79.7%,而AI检测乳腺肿块位置的准确率为100%。(2)住院医师独立诊断TPR为88.6%,PPV为74.6%,FPR为30.6%,FDR为25.4%,FNR为11.4%,NPV为85.7%,TNR为69.4%,FOR为14.3%,AP为80.2%,F0.5-score为77.1%,F1-score为81.0%,F2-score为85.4%,准确率为79.1%。(3)住院医师AI辅助下诊断TPR为83.0%,PPV为77.2%,FPR为24.9%,FDR为22.8%,FNR为17.0%,NPV为81.3%,TNR为75.1%,FOR为18.7%,AP为79.2%,F0.5-score为78.3%,F1-score为80.0%,F2-score为81.7%,准确率为79.1%。(4)主治医师独立诊断TPR为81.3%,PPV为85.1%,FPR为14.5%,FDR为14.9%,FNR为18.7%,NPV为81.8%,TNR为85.5%,FOR为18.2%,AP为83.4%,F0.5-score为84.3%,F1-score为83.1%,F2-score为82.0%,准确率为83.4%。(5)住院医师AI辅助下诊断与住院医师独立诊断TPR、TNR的差异没有统计学意义(P>0.05)。主治医师独立诊断与住院医师独立诊断TPR、TNR的差异具有统计学意义(P<0.05),准确率的差异没有统计学意义(P>0.05)。(6)AI预测、住院医师独立诊断、住院医师AI辅助下诊断和主治医师独立诊断曲线下的面积(AUC)分别为0.796、0.790、0.790和0.868。结论:(1)本研究乳腺肿块检测与良恶性分类诊断采用的AI模型是基于DL方法的CNN中经改进的RFBNet模型,结果表明该AI模型检测与分类的准确率等指标较为理想,可为临床上乳腺肿块的超声诊断提供一定辅助与参考价值。(2)以本研究当前采用的AI模型来看,其诊断效能尚不能进一步提高初、中级医师对乳腺肿块良恶性鉴别诊断的水平。