卷积神经网络和注意力机制在医学图像分割与识别中的应用研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:dfjds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,临床医生对很多疾病的诊断都依靠对医学影像的观察分析,然而,由于成像设备本身成像质量的局限性及临床医生经验和知识水平的限制和影响,医生诊断往往会出现误诊与漏诊。为了缓解这个问题,计算机辅助诊断应运而生。近年来,卷积神经网络被引入到医学图像领域的各种应用中,如疾病分类、预测、病灶检测和图像配准等,且都获得了较大成功。相较于传统的机器学习方法,基于卷积神经网络的深度学习方法可以免去特征工程的繁杂,通过卷积神经网络强大的特征表达能力,端到端的完成任务,并且近年来,有一些研究探索在卷积神经网络中使用注意力机制来提升网络性能。然而,卷积神经网络在医学图像领域的应用仍面临诸多挑战,包括医学图像的数据量较小导致模型训练不充分而性能较差;有些成像仪器的成像质量较差,而加大了模型优化的难度等。针对卷积神经网络在医学图像领域存在的挑战,本论文以全乳超声图像(Automated Whole Breast Ultrasound,ABUS)和眼底视网膜图像为对象,探讨卷积神经网络与注意力机制在医学图像领域的应用。主要研究成果包括如下两个方面:一方面,对于ABUS图像的解剖层分割,本论文提出了一种基于协同注意力的ABUS图像解剖层分割方法。以ResNeXt为基础架构,嵌入空间和通道注意力模块作为编码路径,进一步引入了非局部上下文模块通过计算特征图中任意两个位置之间的关系而捕获长范围依赖,进而帮助提升分割性能。该方法的解码路径采用了权重上采样模块,以获得更好的类特异性上采样效果。同时,引入了协同注意机制,将网络构造成双输入网络,学习连续切片间的相关性,从而提高了连续切片之间的分割一致性。实验验证了该方法对复杂的ABUS图像解剖分割问题的有效性。另一方面,对于早产儿视网膜病变的识别,本论文使用注意力增强的残差网络进行分类。具体来说,我们首先选择ResNet作为我们的基础架构,并嵌入空间和通道注意力模块增强其特征表达能力。然后,我们利用梯度加权类激活映射(gradient-weighted class activation mapping,Grad-CAM)对训练后的模型进行可视化,探讨网络的可解释性问题。实验验证了该方法的有效性,而且该模型还成功地检测到视网膜图像中ROP的病变结构(分界线或脊线)区域。综上,本文以全乳超声图像与眼底视网膜图像为对象,探讨卷积神经网络在医学图像分割与识别中的应用,并且利用注意力机制增强网络的特征表达能力,它是通过注重有用特征,抑制不重要特征实现的。另外协同注意力还可以探索不同输入之间的相关性,在本文中被用于计算全乳超声连续切片的相关性,以保持连续切片分割的一致性。本文进行了大量分析对比实验,验证所使用方法的有效性。本文使用方法,不仅局限于全乳超声图像和眼底视网膜图像,也可扩展于其他医学图像的分析。
其他文献
乳腺癌作为世界上第二种最为常见的癌症类型,是导致女性死亡率增高的原因之一,已经成为女性健康的第一杀手。在乳腺癌的临床诊断环节中,钼靶检查由于具备患者疼痛相对较小、操作简单可重复、分辨率高和检出率高等优势,成为了最先进的乳腺癌检查方法之一。医生通过观察乳腺钼靶图像对患者作出诊断,这一过程通常耗时费力,并且效率不高。为了提高诊断效率,减小误诊风险,针对乳腺钼靶图像开发基于人工智能的计算机辅助诊断系统显
肌萎缩性脊髓侧索硬化症(Amyotrophic lateral sclerosis,ALS)是一种致命的快速进行性神经退行性疾病。依达拉奉(Edaravone,EDA)是目前获美国食品药品管理局批准的仅有的两种药物的其中一种。EDA在疾病早期可减缓患者运动能力的下降,对晚期患者的治疗效果不佳。过去大多数的临床前研究只评估药物对脊髓的治疗效果,而没有把在病理上很重要的运动皮层纳入评估。近来,运动皮层
研究表明,生物组织发生早期病变且尚未在形态结构上产生改变时,生物组织病变部位的电特性(电阻抗、电导率、介电常量)首先发生变化。因此通过检测组织的电特性就有可能达到对疾病早期诊断的目的。生物电阻抗成像(Biological Electrical Impedance Tomography,BEIT)是对组织电特性检测的成像技术,一种继形态结构成像之后的新一代功能成像技术的统称。感应式磁声成像(Magn
面瘫又叫面神经损伤,面容的改变会给患者带来心理焦虑和生理疼痛,严重影响患者的正常人际交往与生活。及时有效地评估治疗与康复训练,有助于面瘫患者尽早康复,恢复正常人的生活质量。本课题调研发现关于面瘫评估的大多数研究是基于面部局部或整体特征进行的。目前的面部特征点检测模型使用正常人面部人脸图像数据进行训练,而面瘫会导致患者面容怪异、口角歪斜,所以使用主流的特征提取模型会出现较大误差。面瘫后面肌运动内在反
在产前超声筛查与诊断中,从三维容积超声或动态超声序列中获取标准面对于后续的生物参数测量、产前畸形诊断和胎儿生长发育评估至关重要。由于产前超声筛查需要获取几十种标准切面,因此使用动态超声序列获取标准面往往非常耗费时间与精力并且依赖医生的临床工作经验。三维容积超声通常可以通过单次扫描便可获取多种标准切面,相较于动态超声序列,其具有更高的效率并减少对医生临床工作经验的依赖。然而,由于三维容积超声本身巨大
超声射频信号是从换能器处获取的回波信号经过前置放大,A/D变换和波束合成后得到的信号,由于其包含比较完整的声场以及组织相互作用信息,在超声设备中将射频信号作为超声图像重建的原始信号。由于在传统的超声成像过程中涉及多个步骤,每个步骤都需要设置许多参数,特别是图像后处理部分,不同厂商的超声成像系统采用不同方法,其成像风格、质量不尽相同而且都根据自己的经验来进行调参。因此提出一种通用的新型超声成像方法,
脑卒中是最常见的脑血管疾病,并且是全世界范围内造成死亡和残疾最常见的原因之一。对特定脑区的标记具有潜在的研究意义,这些标记可以潜在地提供包括病情评估之内的其他信息,以预测病人功能区的恢复情况(例如,运动,言语)和对治疗反应的可能性。此外,结合多种成像模式获得的影像能提供互补的多模态信息,但是直接使用未经配准的多模态影像不仅可能会使得计算机自动分割方法的性能受限,还会增加临床医生的阅片困难。对医学影
在产前超声诊断过程中,胎儿标准切面的检测识别是一个关键步骤,是后续结构观察、生物参数测量、畸形诊断的前提。但是标准面的检测耗时繁琐,严重依赖于操作者的主观经验,对于不同操作经验的医师常做出不同的判断结果。因此设计一种自动化的产前超声标准面分类提取系统,对于减少主观差异、提高诊断效率、降低漏检率具有重要意义。与其他成像方式相比,超声图像质量较差,往往受到形变、噪声、伪影的影像。同时实际应用中对智能算
随着现代人们的生活节奏和饮食习惯正在发生重大的结构性改变,全球肾脏功能疾病的发病率和致死率急剧的增长,特别是慢性的肾脏功能疾病亟待引起人们重视。定期进行尿液筛查能让患者及时地接受治疗,延迟和制止肾脏发生损伤。其中,临床上尿液有形成分的分析和诊断对于肾脏功能疾病以及相关疾病的筛查和预防治疗都具有重要的意义,它有助于及时提供患者尿液中细胞类别及数量的相关信息,进而为泌尿外科医生对肾脏功能疾病的诊断和治
Stewart平台成功的商业应用掀起了对并联机构的研究热潮,包括机构设计以及控制策略开发。并联推台也属于并联机构的一种,它在模拟运动平台和并联机床中扮演着重要角色,特别是位姿控制精度能直接影响模拟运动平台的用户体验和并联机床加工精度,因此,并联推台的位姿控制具有重要意义。目前绝大多数并联推台的驱动机构采用液压或丝杆传动式电机,这种驱动机构虽能提供足够的负载能力,但位姿控制的响应速度和精度都较低,难