论文部分内容阅读
目的意义:发育性髋关节发育不良(Developmental dysplasia of the hip,DDH)是骨科常见病,该病重在早期诊断、早期治疗。虽然现在有超声和X线片等多种筛查和诊断方法,但在早期DDH患者往往没有症状或症状较轻,影像学也可能没有明显改变,同时地区间特别是基层地区医疗水平的差异明显,缺少专业的骨科及影像科医师,目前仍有大量患者被漏诊。因没有得到恰当的治疗,多数患者在20-40岁时症状逐渐加重,而发展成髋关节炎,甚至需要关节置换。膝内翻畸形和膝外翻畸形是很常见的关节畸形,流行病学研究表明双膝内、外翻的患者约占研究人群的25%和60%。可能是原发性或与生长板或骨形成疾病有关。膝关节成角畸形轻者影响患者下肢美观,重者影响患者下肢运动功能、性格、家庭等方面。临床中如未能对膝关节角度进行精确测量和评估,常常容易造成漏诊。如果没能早期诊断并及时矫正畸形定会逐渐超出生理极限而产生疼痛和活动受限等症状,引起膝关节骨性关节炎。随着“保髋”、“保膝”理念的不断深入和普及,对于此类疾病的早期诊断、预防及矫正治疗显得越来越重要。临床迫切需要一个简单而经济有效的科学工具,对大量的骨盆正位片和下肢全长片进行快速准确的筛查,协助早期诊断DDH和膝关节内外翻,初步评估其病变程度。近年来,医疗人工智能技术取得一系列进步,在部分领域已到达甚至超过专业医师水平,具有准确率高、识别速度快、临床应用空间广泛等优势。结合以上临床问题、收集影像数据,提出构建测量sharp角、中心边缘角(Center-edge angle,CEA)、髋膝踝角(Hip-Knee-Ankle angle,HKA)和辅助诊断DDH的人工智能(Artificial Intelligence,AI)模型,快速、准确地对大批量骨科影像进行筛查,降低DDH和膝关节内外翻的漏诊误诊,让此类患者得到早期诊断和治疗。材料方法:1.第2、3章收集吉林大学第二医院图像归档与通信系统(picture archiving and communications system,PACS)中12528和13332例骨盆正位X线片,随机抽取101张和104张骨盆正位X线片不加入模型训练,当作为随机病例参与对模型的验证。对其余图片进行标注、预处理后输入改进的Mask R-CNN模型进行模型训练和测试,合成进行模型训练和构建测试的环境,分别构建自动测量sharp角和自动测量CEA两个模型。两个模型与三位医生测量角度结果通过卡方检验、t检验、Kappa检验、Kendall W一致性检验等方法进行统计分析,验证新模型的准确性和高效率。2.第4章收集医院PACS系统中12325例骨盆正位X线片,随机抽取100张作为测试数据,测试数据不加入模型训练。基于改进的Mask R-CNN算法,通过对12225张骨盆正位片标注数据进行深度学习(Deep Learning,DL),将各角度对应的临床诊断写入模型,构建同时测量髋臼sharp角和CEA并依据角度辅助诊断DDH的模型。邀请30位三甲医院骨科医生(10名主任医生、10名副主任医师、10名主治医师)与该模型进行DDH诊断比赛,基于骨盆正位X线片依据sharp和CEA测量结果诊断DDH的模型与30名骨科医生对100例骨盆正位片进行诊断准确率和效率进行对比分析。3.第5章收集医院PACS系统中738张下肢全长X线片,随机选出100张下肢全长X线片为验证测试数据,验证测试数据不加入模型训练。对其余下肢全长X线片图像进行标注、预处理后输入改进的分割模型进行模型训练和测试,构建并验证自动测量HKA角模型。对自动测量HKA角模型的分割性能进行评估,并和三位医生测量结果进行统计分析。研究结果:1.第2章自动测量髋臼sharp角模型测量sharp角左右侧平均值分别为40.067±4.087°和40.653±4.214°,三位医生测量的左右侧平均值分别为39.353±6.738°和39.821±6.986°,医生测量平均值做为约定真值,模型组与医生组测量结果无明显差别。模型测量101张骨盆正位片的sharp角用时为120秒,医生平均用时150分钟,模型在测量效率方面有绝对优势。模型和医生通过测量sharp角来评价骨盆髋臼结果与最终诊断结果一致性比较,由kappa检验结果可见,模型与最终诊断结果基本一致(P<0.05)。验证了该模型在预测关键特征点、测量sharp角和评估髋臼的准确性。2.第3章自动测量髋臼CEA的模型测量CEA左右侧均值分别为29.46±6.98°和27.92±6.56°;三位医生测量CEA左右侧均值分别为29.85±6.92°和27.75±6.45°。经配对样本t检验分析,左右侧测量值和医生测量平均值间差异均无统计学意义(P>0.05)。选择Kendall W一致性检验方法,得到左侧Kendall W=0.994,P<0.001;右侧Kendall W=0.995,P<0.001,模型与医生测量值呈现高度一致性,验证了该模型在识别关键点及测量髋臼CEA的准确性。3.第4章辅助诊断DDH的模型与30位骨科医生诊断100例骨盆正位片用时和得分进行对比分析结果显示,模型用时134秒,得93分;主任医师组平均用时576.2秒,平均得83.4分;副主任医师组平均用时916.1秒,平均得66.4分;主治医师组平均用时557.0秒,平均得50.8分;所有医生平均用时683.1秒,平均得分66.9分。该模型通过骨盆正位X线片诊断DDH得分高于主任医师组,我们认为该模型通过骨盆正位X线片诊断DDH的水平达到甚至超过专家级水平。4.第5章对自动测量HKA角的模型的三个网络的分割性能进行评估,各深度神经网络(Deep Neural Networks,DNN)的Dice、Recall和Precision值分别为股骨头84.13%、83.21%和86.42%;膝关节93.45%、91.17%和96.16%;踝关节81.79%、76.80%和88.71%。选择3个骨科医生的测量值进行比较,三个医生的测量结果无差异(F=1.041,P>0.05)且一致性较高(Kendall’s W=0.997,P<0.001)。将3个医生的测量平均值作为约定真值,为169.32°±9.88°,模型预测值为169.81±9.61°。两组数据差异无统计学意义(t=0.280,P=0.780)且一致性较高(ICC=0.998,P<0.001)。验证了该模型分割股骨头、膝关节、髋关节和计算中心点测量HKA角的准确性。研究结论:本研究通过对Mask R-CNN算法和分割算法的改进,将通过标注的大量骨盆正位X线片和下肢全长片图像数据输入模型进行训练和测试,成功构建了四个全新有效的医疗模型,分别是自动测量髋臼sharp角模型、自动测量髋臼CEA模型、根据骨盆正位X线片诊断DDH模型、自动测量HKA角模型。四种模型可以对X线片泪滴下缘、股骨头中心点、髋臼外缘、膝关节中心点、踝关节中心点等关键点进行精准定位,根据识别的关键点自动绘制测量sharp角、CEA及HKA角,将不同度数对应的临床诊断用代码写入模型,该模型依据测量到的角度根据诊断标准输出诊断结果。这为骨科影像测量与评估提供了一种新型智能化的测量工具。还为基层和诊断经验较少的医生提供了一个新的可靠的诊断筛查DDH、膝关节内外翻的新方法,将提高基层DDH、膝内外翻的诊断水平,促进医疗公平性。通过本研究验证了Mask R-CNN模型和分割算法在骨科影像测量方面的巨大优势,为骨科影像智能化自动化测量、评估、分类及诊断打下了很好的研究基础。同时给大批量骨盆正位片和下肢全长片进行DDH、膝关节内外翻筛查提供了可能性。通过筛查早期明确诊断,在未出现软骨退变之前帮助临床医生做出决策,制定治疗方案,改善预后。本论文提出的改进型的Mask R-CNN模型及分割模型,不仅能够分担临床病例测量和辅助诊断工作,而且帮助医生节约诊疗时间,提高医疗效率,具有十分重要的临床意义。