论文部分内容阅读
研究背景及目的胶质瘤是中枢神经系统最常见的原发性肿瘤,预后较差,对国家造成了巨大的经济和社会负担。即使相同组织学类型和级别的肿瘤、给予相同的治疗方案预后可能仍存在着较大差异。在以往组织病理学特征的基础上,增加分子病理学信息,有助于胶质瘤更加精确地分类。虽然MRI是包括胶质瘤在内的脑肿瘤的基本检查方法,但胶质瘤MR影像表现多样,有时难以与其他脑肿瘤或病变进行鉴别。甚至不同类型、级别的胶质瘤也会出现相似的MR影像表现、难以鉴别。另外,常规MRI的传统解读方法在胶质瘤分子标记物评估方面也存在较多的困难。胶质瘤以手术治疗为主,术前精准的诊断评估,包括与其他脑肿瘤准确鉴别、胶质瘤组织学类型区分、分子标记物评估等有助于个体化治疗方案的制定及疗效预测。影像组学和深度学习的方法能够更加深入地挖掘影像学信息、揭示肿瘤的病理生理学基础,因此,通过这两种方法对MR图像进行分析,可能有助于进一步提高胶质术前精准诊断评估的水平。在胶质瘤和其他肿瘤鉴别方面,幕上单发脑转移瘤和胶质母细胞瘤的影像鉴别是一个难点,两者的MRI具有相似的表现。由于胶质瘤和脑转移瘤的处理方案存在一些差异,尤其是对于既往没有肿瘤病史的患者,鉴别两种肿瘤具有重要价值。研究发现,胶质母细胞瘤在MR强化病灶周围水肿区常有肿瘤细胞浸润及肿瘤血管生成,而转移瘤MRI强化灶周围水肿区无肿瘤细胞浸润及肿瘤血管生成,所以,利用影像组学方法提取MR增强图像中强化周围水肿区的特征,有可能对两种肿瘤有较好的鉴别价值。而对于小脑高级别胶质瘤,除了转移瘤需要鉴别以外,由于血管母细胞瘤的MR表现多样、诊疗方案与其存在差异,所以,该肿瘤也是需要与高级别胶质瘤鉴别的一种肿瘤。胶质母细胞瘤恶性度高,并且发病率占胶质瘤总数的一半左右。EGFR基因扩增和突变是胶质母细胞瘤最常见的基因改变,EGFR基因扩增状态对胶质母细胞瘤治疗方法的选择及预后具有重要影响。由于EGFR基因扩增与胶质母细胞瘤的细胞增殖、侵袭及血管生成等事件有关,利用影像组学的方法分析瘤区的MR影像有可能深入挖掘出与这些事件相关的特征,实现对EGFR基因扩增状态的预测。少枝胶质细胞瘤的预后相对较好,对于较低级别胶质瘤,进一步评估是少枝胶质细胞瘤还是其他类型胶质瘤具有重要的临床意义。染色体1p/19q联合缺失是少枝胶质细胞瘤的分子标记物,对诊断少枝胶质细胞瘤、鉴别其他胶质瘤及评估预后具有重要价值。基于深度卷积神经网络的深度学习方法在其他图像分类中的优秀表现,利用深度卷积神经网络对染色体1p/19q联合缺失和无染色体1p/19q联合缺失的两类肿瘤MR图像数据进行建模、分类预测可能会得到较好的结果。目前,利用提取的特征建立模型或分类器通常被认为是影像组学研究的最后一个流程,但是建立的模型或分类器的结果并不总是令人满意的,如何进一步提升模型或分类器的表现是临床应用的一个需求。由于建立模型或分类器的算法有很多,各种算法的表现可能存在一定的差异,联合使用多个模型或分类器,类似于临床上多学科专家会诊模式,是否会得到更好的结果也是值得我们研究的一个内容。深度学习通常需要大量带有标记的训练数据,这对于医学图像来说较为困难。利用大规模图像数据训练得到的深度神经网络模型进行迁移学习,在皮肤癌分类、X线骨折诊断等方面均取得了较好的结果。这种迁移学习方法是否可以对胶质瘤分子标记物的预测得到同样的效果是我们所期待的。目前,影像组学研究提取的特征或建立的模型主要是疾病或分类结果特异的,每个研究使用的特征、建立的模型可能都存在一定差异,而且影像组学多为常见病和多发病的研究。影像组学的特征及模型是否具有不同疾病或不同分类结果间的泛化性以及影像组学如何应用于少见病和罕见病均有待于进一步研究。最后,无论是影像组学还是深度学习,它们都不是万能的,在使用过程中需要医生的积极参与。因此,本研究将使用影像组学或深度学习的方法对幕上单发转移瘤和胶质母细胞瘤进行鉴别(实验一)、对小脑高级别胶质瘤和血管母细胞瘤鉴别(实验二)、对胶质母细胞瘤EGFR基因扩增状态进行预测(实验三)、对较低级别胶质瘤染色体1p/19q联合缺失状态进行预测(实验四)。并且,在研究中我们将探索联合使用多分类器的价值(实验一)、针对罕见病借用影像组学模型的可行性(实验二)、使用深度神经网络迁移学习对胶质瘤分子标记物预测的价值(实验四)、探索后续人工分析的应用和价值(实验四)。材料和方法实验一:纳入术前行颅脑MR平扫及增强检查的180例经常规病理学确诊的幕上单发脑肿瘤患者(脑转移瘤90例,胶质母细胞瘤90例),数据按8:2随机分组至训练集和测试集。提取肿瘤强化周围水肿区的定量影像组学特征,经过特征筛选及处理后,建立5个分类器,进一步通过使用相同权重投票及不同权重逻辑回归分析的方法联合使用这些分类器。分析单个分类器及联合使用分类器对幕上单发脑转移瘤和胶质母细胞瘤的鉴别能力;使用准确度、敏感度、特异度、约登指数评估单个分类器及联合使用这些分类器的表现。实验二:纳入术前行颅脑MR平扫及增强扫描的30例经病理确诊的小脑高级别胶质瘤和血管母细胞瘤的患者(高级别胶质瘤15例,血管母细胞瘤15例),借用已建立的鉴别胶质母细胞瘤和毛细胞型星形细胞瘤的影像组学模型(GBM-PA模型)对本研究中纳入的高级别胶质瘤和血管母细胞瘤进行鉴别;同时,根据高级别胶质瘤与转移瘤的强化模式相似的病理学基础,纳入15例小脑单发转移瘤的病例进行验证,使用同样模型对转移瘤和血管母细胞瘤进行鉴别。对模型中的胶质母细胞瘤分别使用高级别胶质瘤和转移瘤进行标签置换,对模型中的毛细胞型星形细胞瘤使用血管母细胞瘤进行标签置换。以准确度、敏感度、特异度作为评价借用模型对小脑高级别胶质瘤和血管母细胞瘤鉴别的能力。实验三:纳入术前行颅脑MR平扫及增强扫描的50例经常规病理学确诊GBM并行分子病理学EGFR基因扩增状态检测的患者,按约7:3比例随机分组至训练集和测试集,高通量提取MR增强图像中瘤区的影像组学特征。根据特征稳定性(依据组内相关系数(Intraclass correlation efficient,ICC)值)及Lasso回归等算法对训练集数据进行特征筛选,使用筛选后的特征建立逻辑回归模型、支持向量机模型及神经网络模型,以模型在训练集及测试集的受试者工作曲线(ROC曲线)下面积(AUC)作为模型评价标准。实验四:纳入术前行颅脑磁共振平扫的140例经常规病理学确诊为较低级别胶质瘤,并行分子病理学检测染色体1p/19q联合缺失状态的患者,获取肿瘤T2W图像712幅,按约8:1:1比例随机分为训练数据、验证数据及测试数据。使用训练集图像及数据扩增方法重新训练GoogleNet Inception v3深度卷积神经网络的顶层。迭代次数为5000次,初始学习率0.01。使用159例TCIA公共数据集病例作为外部测试数据。为进一步提高病例的预测准确度,对测试数据中预测错误病例的肿瘤位置特征进行简单的人工分析,对人工分析提取的共性特征通过相应的TCIA外部测试数据进行验证。实验结果实验一:每个肿瘤共提取271个特征,经过特征筛选保留8个特征。在训练集中,5个分类器的准确度为0.67-0.80,敏感度0.60~0.82,特异度0.63~0.86,约登指数为0.34~0.60;测试集中5个分类器的准确度为0.61~0.69,敏感度0.39-0.72,特异度0.50~0.83,约登指数为0.22~0.39。通过相同权重投票的方法,训练集中5个分类器联合后的准确度为0.73,敏感度0.76,特异度0.69,约登指数为0.45,测试集中5个分类器联合后的准确度为0.61,敏感度0.56,特异度0.67,约登指数为0.23。训练集中,对于5个分类器预测结果一致的病例,分类器鉴别准确度为0.86,敏感度0.80,特异度0.91,约登指数为0.71;测试集中相应准确度为0.77,敏感度0.75,特异度0.78,约登指数0.53。使用不同权重,联合使用5个分类器的总体表现并不突出。实验二:借用模型对小脑高级别胶质瘤和血管母细胞瘤鉴别的准确度为0.73,敏感度1.0,特异度0.47。作为对照验证,借用模型对转移瘤和血管母细胞瘤的鉴别得到了相同的结果。实验三:共提取肿瘤区MR影像组学特征102个,经特征筛选保留3个特征,包括一个形态学特征original_shape_SurfaceVolumeRatio,一个灰度共生矩阵特征original_glcm_MaximumProbability 和 一 个 灰 度 相 关 矩 阵 特 征original_gldm_LargeDependenceHighGrayLevelEmphasis。逻辑回归模型、支持向量机模型及神经网络模型在训练集的AUC值分别为0.85,0.84和0.84,在测试集的AUC 值分别为 0.84,0.84,0.82。实验四:基于深度卷积神经网络学习,训练数据、验证数据、测试数据、外部TCIA测试数据的准确度分别为0.94、0.68、0.77和0.73。测试数据中预测错误的14个病例(15幅图像)中有3例肿瘤主要位于皮层下,均为无染色体1p/19q联合缺失而误判为染色体1p/19q联合缺失病例,TCIA外部测试数据中14例误判为染色体1p/19q联合缺失的病例中有5例肿瘤主要位于皮层下。结合肿瘤位置分析,测试集和TCIA外部测试集的准确度达0.81和0.75。结论综述所述,我们研究显示:(1)使用强化周围水肿区的8个影像组学特征鉴别幕上单发转移瘤和胶质母细胞瘤具有一定的价值。联合使用多个分类器,能够带来额外的鉴别诊断益处,尤其是当多个分类器表现一致的时候,对两种肿瘤的鉴别能力有进一步提升。(2)借用GBM-PA模型对小脑高级别胶质瘤和血管母细胞瘤的鉴别具有可行性,提示影像组学特征或模型具有泛化性。(3)使用胶质母细胞瘤MR增强图像中瘤区的3个特征预测EGFR基因扩增状态具有较好的价值。(4)使用GoogleNetinception-v3深度卷积神经网络对预测颅内较低级别胶质瘤染色体1p/19q联合缺失状态具有较好的预测价值,结合人工分析有助于进一步提高对病例的预测准确性。