论文部分内容阅读
研究背景近年来,全球糖尿病患者数量逐年增加,2017年全球成人糖尿病患者数量为4.51亿。2018年,中国糖尿病患者发病人数超过1亿,位于世界第二位。在眼科,糖尿病主要引起糖尿病视网膜病变,严重威胁患者视力。而全球估计有38%的糖尿病患者罹患视网膜病变。尽早诊断非增殖性糖尿病视网膜病变并经过及时治疗可长期保持有效的视力,延误治疗易造成严重视力损害。但是,我国注册眼科医师数量少,需接受筛查的患者数量较大,发展远程智能筛查糖尿病视网膜疾病的技术就显得尤为重要。近十年来,随着大数据时代到临及计算机算力的提高,机器学习、深度学习算法的高速发展,以及卷积神经网络对人类神经系统的成功模仿,推动了人工智能技术的发展。目前,卷积神经网络已成功运用于医学图像分类任务。在眼科学领域,已有大量人工智能研究运用于视网膜疾病、青光眼、白内障及角膜病变等相关疾病的筛查诊断。美国卫生监管机构食品药品监督管理局(Food and Drug Administration,FDA)已于2018年4月批准了世界上第一款人工智能医疗设备IDx-DR用于检测DR。2018年8月1日起,我国《医疗器械分类目录》正式生效。该目录将AI件列为二类、三类医疗器械。中国医药教育协会智能医学专委会智能眼科学组发表《基于眼底照相的糖尿病视网膜病变人工智能筛查系统应用指南》,对未来AI模型建立的DR诊断筛查平台及临床应用中各方面为AI诊断系统使用机构提供参考性意见,并进行规范。但是目前,因对机器学习工程师能力要求较高,训练及研发成本高昂,数据集数量、图片质量、标注质量参差不齐以及数据壁垒、隐私权利复杂性,机器学习模型在基层医疗的广泛使用依然受到了较大限制。在临床诊疗过程中,糖尿病视网膜病变常需要与多种其他视网膜血管性疾病进行鉴别诊断。在研究基于机器学习检测糖尿病视网膜病变的过程中,我们发现糖尿病视网膜病变与视网膜静脉阻塞二者间存在的相似特征改变,从计算机角度看,同样会使糖尿病视网膜病变检测模型误判。当糖尿病视网膜病变模型训练阶段未加入足够数量的视网膜静脉阻塞图片作为负样本,会使得训练出的模型无法正确分辨糖尿病视网膜病变图片和视网膜静脉阻塞图片。上述问题在基于机器学习的视网膜疾病检测研究中是普遍的,即不充分的训练数据导致模型在不同应用场景时可能预测效果不佳。一种常用的解决方法是不断增加各种疾病的医学图像以满足训练数据的多样性,避免模型过拟合或欠拟合,并尽可能学习更多疾病的概率分布模式。这种方法虽然有效,但在医疗领域中的应用却存在诸多困难,具体包括:(1)医学图像数量有局限。一些疾病的临床上发病率低,导致医学图像少。而目前主流的深度学习算法需要大量训练数据才能保证效果,这就造成了训练数据的需求和收集无法匹配的矛盾。(2)数据清洗困难。当前医疗图像诊断领域算法一般为监督学习,即需要医疗图像及其标签,通过临床诊断结果进行训练,模型准确度高度依赖图像质量和标签质量。在实际应用中,由于仪器厂商和临床医生等因素差异,很难保证图像清晰度、标签准确性等训练数据的绝对高质量。(3)训练模型成本高。建立大规模训练数据集需要多个医疗机构、医生及算法计算机工程师的共同参与,协调沟通可能导致周期长、成本高。另外,医学图像的使用还涉及到隐私保护和伦理等问题。因此,初始训练集疾病种类和数量不可能无限制扩张,而每次增加数据量后重复深度学习模型的训练和调优还需要大量算力,成本高昂。上述困难导致了人工智能检测视网膜疾病的高门槛,阻碍了机器学习在视网膜疾病诊断领域的普及应用。研究方法为了背景中所提问题,本文收集Kaggle竞赛中国糖尿病视网膜病变眼底照片公开数据集及香港大学深圳医院眼科视网膜静脉阻塞眼底照片数据集,并提出了一种基于小规模视网膜疾病训练数据的双层机器学习模型方法的低成本解决方案。具体地,本论文实验方法为:1.研究基于ResNet的糖尿病视网膜病变检测基线模型,并检测该模型在敏感度、特异性、精确度、准确率等指标上的基本效果;2.检测视网膜静脉阻塞眼底照片对糖尿病视网膜病变检测基线模型敏感度、特异性、精确度、准确率等指标的影响;3.基于ResNet利用小规模数据集建立识别视网膜静脉阻塞的稳定微模型。在基线模型和微模型之上使用逻辑回归算法训练一个轻量双层模型综合判读检测结果。结果1.利用Kaggle公开数据集建立基于ResNet的糖尿病视网膜病变检测模型,该模型敏感度及F1值达92%,精确度为93%,准确率为88%。2.在同等测试集容量下,混合视网膜静脉阻塞眼底照片的测试集会导致糖尿病视网膜病变诊断模型的特异性下降17%,精确度下降9%,准确率下降8%。3.相对于2中的实验,双层模型对混合视网膜静脉阻塞图片测试集的特异性提升了 23%,准确率提升了 10%。结论本次实验中创新性地使用双层模型:在已有糖尿病视网膜病变的基线模型保证基本的检测效果,再利用小规模数据集建立识别视网膜静脉阻塞的微模型,最后在基线模型和微模型之上训练一个轻量双层模型综合判读检测结果。双层模型既有效缓解了视网膜静脉阻塞照片对糖尿病视网膜诊断基线模型的干扰问题,又避免了高成本的重复训练。所提方法用类似打补丁的方式解决了数据干扰问题,又不需要大量的重复训练,可以进一步推广到其他医学诊断领域。另外,本文的大部分实验在云服务上完成,提供了一种可供医务工作者操作的实践参考,进一步降低了医务工作者在人工智能领域中操作实践视网膜疾病诊断应用研究的门槛。