机器学习在视网膜疾病中的应用研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:doraemon1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景近年来,全球糖尿病患者数量逐年增加,2017年全球成人糖尿病患者数量为4.51亿。2018年,中国糖尿病患者发病人数超过1亿,位于世界第二位。在眼科,糖尿病主要引起糖尿病视网膜病变,严重威胁患者视力。而全球估计有38%的糖尿病患者罹患视网膜病变。尽早诊断非增殖性糖尿病视网膜病变并经过及时治疗可长期保持有效的视力,延误治疗易造成严重视力损害。但是,我国注册眼科医师数量少,需接受筛查的患者数量较大,发展远程智能筛查糖尿病视网膜疾病的技术就显得尤为重要。近十年来,随着大数据时代到临及计算机算力的提高,机器学习、深度学习算法的高速发展,以及卷积神经网络对人类神经系统的成功模仿,推动了人工智能技术的发展。目前,卷积神经网络已成功运用于医学图像分类任务。在眼科学领域,已有大量人工智能研究运用于视网膜疾病、青光眼、白内障及角膜病变等相关疾病的筛查诊断。美国卫生监管机构食品药品监督管理局(Food and Drug Administration,FDA)已于2018年4月批准了世界上第一款人工智能医疗设备IDx-DR用于检测DR。2018年8月1日起,我国《医疗器械分类目录》正式生效。该目录将AI件列为二类、三类医疗器械。中国医药教育协会智能医学专委会智能眼科学组发表《基于眼底照相的糖尿病视网膜病变人工智能筛查系统应用指南》,对未来AI模型建立的DR诊断筛查平台及临床应用中各方面为AI诊断系统使用机构提供参考性意见,并进行规范。但是目前,因对机器学习工程师能力要求较高,训练及研发成本高昂,数据集数量、图片质量、标注质量参差不齐以及数据壁垒、隐私权利复杂性,机器学习模型在基层医疗的广泛使用依然受到了较大限制。在临床诊疗过程中,糖尿病视网膜病变常需要与多种其他视网膜血管性疾病进行鉴别诊断。在研究基于机器学习检测糖尿病视网膜病变的过程中,我们发现糖尿病视网膜病变与视网膜静脉阻塞二者间存在的相似特征改变,从计算机角度看,同样会使糖尿病视网膜病变检测模型误判。当糖尿病视网膜病变模型训练阶段未加入足够数量的视网膜静脉阻塞图片作为负样本,会使得训练出的模型无法正确分辨糖尿病视网膜病变图片和视网膜静脉阻塞图片。上述问题在基于机器学习的视网膜疾病检测研究中是普遍的,即不充分的训练数据导致模型在不同应用场景时可能预测效果不佳。一种常用的解决方法是不断增加各种疾病的医学图像以满足训练数据的多样性,避免模型过拟合或欠拟合,并尽可能学习更多疾病的概率分布模式。这种方法虽然有效,但在医疗领域中的应用却存在诸多困难,具体包括:(1)医学图像数量有局限。一些疾病的临床上发病率低,导致医学图像少。而目前主流的深度学习算法需要大量训练数据才能保证效果,这就造成了训练数据的需求和收集无法匹配的矛盾。(2)数据清洗困难。当前医疗图像诊断领域算法一般为监督学习,即需要医疗图像及其标签,通过临床诊断结果进行训练,模型准确度高度依赖图像质量和标签质量。在实际应用中,由于仪器厂商和临床医生等因素差异,很难保证图像清晰度、标签准确性等训练数据的绝对高质量。(3)训练模型成本高。建立大规模训练数据集需要多个医疗机构、医生及算法计算机工程师的共同参与,协调沟通可能导致周期长、成本高。另外,医学图像的使用还涉及到隐私保护和伦理等问题。因此,初始训练集疾病种类和数量不可能无限制扩张,而每次增加数据量后重复深度学习模型的训练和调优还需要大量算力,成本高昂。上述困难导致了人工智能检测视网膜疾病的高门槛,阻碍了机器学习在视网膜疾病诊断领域的普及应用。研究方法为了背景中所提问题,本文收集Kaggle竞赛中国糖尿病视网膜病变眼底照片公开数据集及香港大学深圳医院眼科视网膜静脉阻塞眼底照片数据集,并提出了一种基于小规模视网膜疾病训练数据的双层机器学习模型方法的低成本解决方案。具体地,本论文实验方法为:1.研究基于ResNet的糖尿病视网膜病变检测基线模型,并检测该模型在敏感度、特异性、精确度、准确率等指标上的基本效果;2.检测视网膜静脉阻塞眼底照片对糖尿病视网膜病变检测基线模型敏感度、特异性、精确度、准确率等指标的影响;3.基于ResNet利用小规模数据集建立识别视网膜静脉阻塞的稳定微模型。在基线模型和微模型之上使用逻辑回归算法训练一个轻量双层模型综合判读检测结果。结果1.利用Kaggle公开数据集建立基于ResNet的糖尿病视网膜病变检测模型,该模型敏感度及F1值达92%,精确度为93%,准确率为88%。2.在同等测试集容量下,混合视网膜静脉阻塞眼底照片的测试集会导致糖尿病视网膜病变诊断模型的特异性下降17%,精确度下降9%,准确率下降8%。3.相对于2中的实验,双层模型对混合视网膜静脉阻塞图片测试集的特异性提升了 23%,准确率提升了 10%。结论本次实验中创新性地使用双层模型:在已有糖尿病视网膜病变的基线模型保证基本的检测效果,再利用小规模数据集建立识别视网膜静脉阻塞的微模型,最后在基线模型和微模型之上训练一个轻量双层模型综合判读检测结果。双层模型既有效缓解了视网膜静脉阻塞照片对糖尿病视网膜诊断基线模型的干扰问题,又避免了高成本的重复训练。所提方法用类似打补丁的方式解决了数据干扰问题,又不需要大量的重复训练,可以进一步推广到其他医学诊断领域。另外,本文的大部分实验在云服务上完成,提供了一种可供医务工作者操作的实践参考,进一步降低了医务工作者在人工智能领域中操作实践视网膜疾病诊断应用研究的门槛。
其他文献
经济是税收的源泉,经济决定税收的产生,经济规模决定税收的规模,经济发展水平决定税负水平,经济科技含量决定税收增长,经济改革决定税收改革;而反之,税收是经济的客观反映,能够映证经济的发展态势,对经济有显著反作用,主要通过税种增减、税率调整、减免税范围、税负水平、征管努力程度等要素调节经济运行效率和各方经济利益,从而影响和推动经济发展。换言之,经济税收的发展相辅相成、紧密相关,一般情况下,经济税收的运
公元前6—前4世纪,即希腊的古风时代末期和整个古典时代,雅典人在爱琴海北部的色雷斯“蛮族人”居住地区开展了殖民活动。在此之前,优卑亚人、麦加拉人、以及来自爱琴海各个岛屿及沿岸的其他希腊人,已经在色雷斯地区的爱琴海沿岸建立了一些殖民地。然而,在希腊人与色雷斯人的经济和文化交往中,雅典人却独领风骚。雅典人的殖民活动,一方面影响了色雷斯人的货币体系、语言习俗、墓葬风格等,并经由色雷斯雇佣军这种途径帮助塑
在无根结线虫危害条件下,利用线虫绝3号、4号番茄砧木嫁接金棚1号番茄,研究嫁接对番茄抗逆性、叶绿素含量、产量、品质等方面的影响。结果表明:嫁接后可明显提高番茄抗低温能
随着无人驾驶技术的不断发展进步和各类环境问题的日益突出,电动汽车正逐步成为人类生产生活中不可或缺的交通工具。电动汽车配套设备和充电续航技术也渐渐成为研究热点。目
近年来,国家大力发展装配式建筑,与之相关的政策纷纷出台,发展和实施装配式建筑已成为建筑业发展的大趋势。装配式钢结构建筑是以钢结构为承重结构的一种装配式建筑,具有材料轻质
报纸
背景:吞咽困难是后路寰枢椎复位术后相对少见而严重的并发症之一,对于这种并发症的形成原因目前意见尚不统一。目的:研究后路寰枢椎复位手术后各项解剖数据的变化,比较不同手术方式对术后吞咽困难的影响,探讨术后出现吞咽困难的原因。方法:回顾性分析重庆医科大学附属第一医院自2015年3月至2019年9月间行后路寰枢椎复位术的33例患者。随访患者术后6个月内的吞咽困难症状,在CT上测量患者手术前后的枕骨舌骨间距
2010年9月1日,以国务院577号令公布的《自然灾害救助条例》(以下简称《条例》)正式施行。《条例》的出台,从法律上肯定了灾害救助工作多年来形成的工作原则、制度、方法,确立了灾
单音节副词重叠式是汉语副词中很重要的一类,是对外汉语教学中的重点,也是难点。所以本文基于单音节副词重叠式的本体研究,从对外汉语教学角度,对单音节副词重叠式的偏误现象
增强现实(AR)技术因其虚实结合、实时交互、三维注册和深度沉浸等特性,近年来被广泛地应用到旅游领域,主题公园作为重要的旅游吸引物,对AR技术的应用尤为关注。迪士尼、华强