论文部分内容阅读
影像组学是医学影像学领域近年来研究的热点,通过从CT等医学图像中提取高通量特征,结合人工智能分析,可为疾病的精准诊疗评估提供有价值的信息。然而,目前影像组学研究尚缺乏完善的标准,其研究结果的可重复性受到极大挑战。虽然已有学者提出了影像组学研究的标准和建议,但其仍有待完善。小波特征是图像通过小波分解后计算所得的特征,蕴含图像的高维信息,是图像特征的重要组成部分之一,已被广泛应用于医学影像组学研究中。然而,对于影像组学中小波特征的计算,特别是小波基的选择方面,并没有统一的标准和建议,不同的小波基对图像滤波后计算所得特征的影响不明确。因此,本研究以结直肠癌CT图像为例,探究不同的小波基的小波分解对影像组学特征的稳定性和诊断效能的影响,从而规范小波基使用方法,为影像组学研究提供小波基选择标准和建议。本研究收集了256例结直肠癌患者的术前CT图像和临床资料,将病例分为训练组(180例)和验证组(76例)。在完成CT图像肿瘤感兴趣区的勾画后,应用本人基于MATLAB软件编写的影像组学特征提取软件提取了91个非小波特征和52个不同小波基的小波特征集。基于训练组数据,分析不同小波特征集中616个同名特征的稳定性,即特征所蕴含图像信息的相似性。通过计算任意两个小波特征集中对应同名特征的组内相关系数(ICC)以判断特征的稳定性;其中ICC大于0.8的特征被判为稳定特征,然后记录相应两个特征集之间稳定特征的数量以及每个特征被判定为稳定特征的次数。研究结果显示,小波基阶数差异越大,对应的特征集之间稳定的特征越少,特征集间相似的信息越少。在单个特征方面,关于非均匀性度量的特征和邻域灰度差分矩阵(NGTDM)的特征受不同小波基的小波分解影响小。在训练组中,使用最小绝对收缩与选择算子(LASSO)基于不同特征集分别建立与结直肠癌Ki-67表达状态、EGFR(表皮生长因子受体)基因突变情况,及区域淋巴结转移相关的预测模型。在验证组中对模型的效能进行验证,使用受试者工作特征曲线下面积评价各特征集对上述3个指标的预测效能。研究结果发现,部分小波基的特征能提高模型的效能,但针对不同研究指标其诊断效能最好的小波特征集并不相同。通过分析特征集组合的诊断效能发现,使用过多的特征容易导致模型过拟合,并降低建模的效率。基于以上分析,本研究对上述3个指标均提出一个有应用潜力的诊断模型以及一个包含7个小波基的合理组合。本文通过对不同小波基的特征集中特征的稳定性和诊断效能的分析,提出影像组学研究中计算小波特征时的建议,为进行更高效的影像组学研究提供指导与参考。应选择阶数差异大的小波基组合,可以选择包含db1,db5,db10,sym8,bior3.3,bior1.5和rbio3.1这个组合,并避免重复计算非均匀性和NGTDM特征等包含相似信息的特征,以避免特征冗余及模型过拟合问题,然后通过单个小波特征集的诊断效能分析并对诊断效能最优的5个小波特征集进行适当组合和分析,得到诊断效能最佳的模型。