【摘 要】
:
由于医学数据自身的特殊性,传统计算机视觉任务中表现良好的深度学习算法很难直接有效地应用在医学影像分析领域。自然图像和医学影像在深度学习模型表现效果上的区别,可归结为医学影像数据没有足够的规模,以及现有的深度学习算法设计的潜在物理思想与医学影像数据对应的动态生理系统的失配。在医学影像分析需求日益增加的今天,探究深度学习背景下适配医学小数据集的新方法具有重要意义。以往的相关研究主要集中在扩增数据规模,
论文部分内容阅读
由于医学数据自身的特殊性,传统计算机视觉任务中表现良好的深度学习算法很难直接有效地应用在医学影像分析领域。自然图像和医学影像在深度学习模型表现效果上的区别,可归结为医学影像数据没有足够的规模,以及现有的深度学习算法设计的潜在物理思想与医学影像数据对应的动态生理系统的失配。在医学影像分析需求日益增加的今天,探究深度学习背景下适配医学小数据集的新方法具有重要意义。以往的相关研究主要集中在扩增数据规模,借助迁移学习和设计更贴合医学影像数据动态生理系统的有效表征等三个方向。本研究受到交叉对比网络的启发,提出了一种全新的结构即孪生交叉对比网络,将三种增强医学小数据集适应性的策略融合进一个端到端的网络中。从结构上看,该网络主要由孪生特征提取器和辅助分类器组成。在度量学习的框架下,基于信息相似度理论而新设计的距离度量,引导孪生特征提取器挖掘具有足够区分度和更贴合医学影像数据潜在动态生理系统的特征,辅助分类器作为孪生结构的下游网络,利用提取到的特征直接输出预测结果。在本研究中,为了单一评估新设计距离度量对提取特征的影响,将辅助分类器的梯度进行截断,在实际应用中,可以依据处理问题的具体情形,选择解放梯度回传。孪生交叉对比网络主要有如下特点:1.从扩增数据角度看,借助度量学习的框架,将数据随机匹配成对,间接扩增了训练可用的有效数据对,同时数据间的比对也蕴含丰富的信息。孪生结构的引入,简化了数据的输入和配对过程,在一定程度上实现随机输入,辅助分类器的引入简化了度量学习的预测过程,直接输出分类结果。2.从设计更贴合医学影像数据动态生理系统的有效表征角度看,基于信息相似度理论的距离度量更关注特征概率次序,降低了对优势特征显著性的需求,更贴合实际生理系统中病灶区域与背景组织对比分辨率不断变化,病灶区域过小,甚至非显著可见等情形,符合医学系统潜在的物理思想,更容易在生理系统间保持稳定。3.从迁移学习角度看,孪生特征提取器的基础模型可以使用任意有效的深度卷积网络,初始化参数通过预训练得到,在实际应用中可以选择训练全部或是冻结部分参数。本研究在一个腹部CT影像中肝细胞癌和肝内胆管细胞癌的分类诊断任务上进行了验证,并提供了详细的结果和可视化分析,在二分类和三分类任务中的最优准确率效果分别为94.2%和90.2%。
其他文献
海陆风是发生在沿海地区由海陆热力差异引起的中尺度局地环流,通过影响大气边界层来改变局地的温度、湿度还有风场等气象要素,进而对局地天气、气候产生影响。受局地天气和地形等条件的影响,目前对于海陆风的探讨多局限于局部地区或城市,对于中国沿海多地海陆风的比较研究还比较缺乏。本文利用2015——2018年的气象观测数据和再分析资料等统计中国沿海主要城市群的海陆风天气特征规律并比较不同地区间的差异,分析纯海陆
“建设教育强国是中华民族伟大复兴的基础工程”,提升高等教育质量,建设一流学科、培养一流人才,提升学生综合素质成为21世纪的教学主流。为了更好的培养学生的合作能力,带动学生全面发展,本文对在线教育进行相关分析,结合时代特征,笔者将MOOC和SPOC(Small Private Open Courses)的比较,通过相关数据的分析和整理,了解当今SPOC的发展状况并结合当今线上教育的研究热点,针对当前
时间序列预测问题的研究至关重要,从电商销量预测到股票价格预测等,随处可见其应用场景。时间序列预测任务也是学术界长久以来的研究重点,随着数据形式的复杂化,模型也从最初基于序列稳定性假设的传统统计学方法发展到可以处理非平稳数据的机器学习方法,然而序列特征表示和损失函数的设计等问题仍然是时间序列预测面临的挑战。本文针对时间序列预测中的特征表示问题,结合现在神经网络方法的优势,利用时序卷积模型、注意力机制
共享经济的号召和互联网的迅速发展滋生了很多有活力的企业,这些企业平台遍布于人们的衣食住行。传统模式下,房屋租售更多是通过电话资源、售楼部实地查看或者是其他更多通过人力来解决的方式。这种模式下的房屋交易,不仅费时费力,也不具备很好的透明度和安全性。一些销售平台的出现,如链家网、贝壳找房等,具备了房屋展示功能,用户可以浏览和选择,但是仍然缺乏非常便利的沟通功能。基于当前市场房屋资源的不合理闲置率,以及
品牌竞争力的核心就是提高对手的准入成本,提高消费者的转换成本。品牌无法长红,错的不是流量而是品牌无根首先,我们看一个网红品牌是怎么诞生的。我现在给出一个公式:高成长赛道+大流量曝光+大网红带货=网红品牌。首先,这个产品必须处于一个高成长的赛道。如近几年的美妆、新茶饮、
SWAT分布式水文模型已广泛地应用于流域水资源的模拟研究。然而,SWAT模型中地下水模块较为简单,而地下水作为区域水资源的重要组成部分,其与地表水在时空上的交互关系对区域地表-地下水资源联合调度具有十分重要的意义。因此,本文以句容市北山水库流域为例,采用SWAT-MODFLOW分布式耦合模拟程序在QGIS软件平台构建该流域的地表-地下水耦合模型,阐明研究区地表-地下水相互作用关系,对完善中小流域的
量子计算机与经典计算机相比较有独特的优势。它的计算能力随着比特数目的增加而指数增加,且更适合用来模拟量子系统,因此量子计算已成为当前的研究热点。实现量子计算的物理体系有很多,超导量子比特,离子阱,NV色心等。超导体系由于和半导体技术兼容,可拓展性强,是当前很有潜力的方案之一。本文首先介绍了量子计算的原理,介绍了量子比特,量子门和量子测量。其次通过引入电路量子电动力学,我们介绍了超导量子比特原理,包
受气候、地理、人类活动等多要素综合影响,径流序列兼有周期性、随机性、趋势性等特点。河川径流承担着航运、发电、灌溉等重要作用,准确高效的径流预报对于水利工程调度、防汛抗旱决策以及水资源开发利用等工作具有重要指导意义。本文针对当前日径流预测模型预见期较短的问题,研究基于机器学习的水文建模和预报的理论方法。首先,构建贝叶斯岭回归(BRR)、支持向量机回归(SVR)、随机森林回归(RFR)、K近邻(KNN