基于深度学习的乳腺电子病历辅助诊断研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:xby520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历记录了患者在检查与治疗疾病过程中产生的重要临床数据,包含大量的医疗知识,通过挖掘和利用这些知识对于医疗健康事业的发展有重要作用。但是,目前大部分电子病历都以非结构化的文本形式存储,一是难以从这些杂乱、冗余及高复杂的文本数据直接获取规范并有价值的数据;二是无法直接应用人工智能算法去进一步挖掘分析。因此,电子病历的结构化问题成为人工智能时代研究的热点,在医疗领域中最重要的工作主要集中在实体识别和关系抽取等方面。通过抽取电子病历中临床诊疗信息,进而能够利用人工智能算法为医生临床诊断提供辅助参考,同时为患者提供个性化诊疗方案。
  本文工作主要基于对上海市某大型三甲医院的真实乳腺电子病历临床数据的分析,设计并实现了一个基于深度学习的乳腺电子病历辅助诊断预测系统。主要研究内容如下:
  1)提出了一种乳腺电子病历的实体和关系联合抽取方法
  该方法首先采用Doc2Vec对文本进行向量化,利用k-means聚类算法对电子病历数据进行归并,参照i2b2(2010)提出的电子病历的实体和关系类别标注规范,从每个簇中筛选数据作为训练集进行标注。然后,采用深度学习中的Bi-LSTM和CNN算法构建了实体识别与关系抽取的联合模型,利用该联合模型对乳腺电子病历进行实体识别与关系抽取。该模型的特点是加入attention机制,使其能更加有效地提取电子病历中较长语句的的语义特征;加入神经网络编码层,实现模型参数共享和联合学习,不仅完成了对大量数据自动命名实体识别任务,而且同时还完成了关系抽取任务,弥补分别进行这两个任务时产生的错误传播和缺少依赖的缺陷,提高了结果的准确率。
  2)提出了一种基于树搜索的层次多标签乳腺疾病分类预测方法
  由于乳腺疾病患者的患病情况较为复杂,同一位患者可能会患有多种相关疾病,每个大类疾病分类下可能会存在很多的小类疾病,而小类疾病分类下又可能存在更细粒度的疾病类别。传统的分类问题(如二分类和多标签分类)往往会忽略各标签之间存在的依赖关系并且分类算法输出数目呈指数级,占用空间过大,造成预测性能不佳。因此本文提出了一种基于树搜索的层次多标签乳腺疾病分类方法,利用树结构可以充分考虑到标签集之间的层次结构的依赖关系,规范化诊断结论。按诊断结果之间的层次关系构建了层次多标签树,通过对标签树的路径搜索,最终实现乳腺疾病的多标签分类 。
  3)设计并实现了一个基于深度学习的乳腺电子病历辅助诊断预测系统
  该系统可以根据输入的患者电子病历文本自动识别文本中的医疗实体,抽取相应关系,最终利用基于树搜索的层次多标签乳腺疾病分类预测方法对患者所患疾病的风险性进行预测,起到了辅助医生诊断效果。
其他文献
该文简述了CDMA(码分多址)数字移动通信系统的原理以及发展概况,详细阐述了最大似然译码和维特比(Viterbi)译码算法的原理.在Viterbi译码算法的基础上,对其进行改进:以双蝶形结构代替传统的单蝶形结构.提高了加-比-选(ACS)单元的吞吐量,加快了Viterbi译码器的处理速度.Viterbi译码器的硬件设计采用了先进的现场可编程门阵列(FPGA),该文首先对电子设计自动化(EDA)和集
学位
1950年Phillips公司的P·W·Haagman等人发现施主掺杂的BaTiO半导瓷材料具有PTCR效应,半个世纪以来,PTCR效应的理论及应用研究得到较快发展.Heywang-Jonker势垒模型、Daniels钡缺位扩散模型及叠加势垒模型较好地解释了PTCR效应的有关实验现象,使得PTCR效应的理论研究日臻成熟.以BaTiO半导瓷材料为基础而发展起来的PTCR热敏元件已广泛应用于通信、家电
学位
计算机辅助设计软件的应用大大的缩短了汽车前照灯设计的周期并且降低了成本.在汽车前照灯CAD设计系统中一个非常重要的模块就是光型模拟系统,它能够直观并且细节化地显示所设计的前照灯的光型分布.光型模拟系统包括多种显示方法,比如等照度曲线,仿真模拟等等.该文将对仿真模拟前照灯的光型分布做出探讨.该文首先介绍了道路照明的发展历史和汽车前照灯的配光标准以及配光显示.然后,在介绍了汽车前照灯的CAD设计流程之
学位
频率和波达方(Direction.of-Arrival,DOA)是反映辐射源特征的两大重要参数,对这两种参数的精确估计在电子侦察、目标定位等方面有着广泛的应用。传统的信号参数估计方法都是基于奈奎斯特采样框架。互质采样是近几年来出现的一种新的稀疏采样理论,主要包含时域的互质采样和空域的互质阵列,互质采样技术可以有效地降低系统对射频前端硬件的要求和后续的数据运算量,因此受到国内外的广泛关注。时域互质采
学位
短波技术至今已取得了长足的发展,随着电子与通信技术的不断推陈出新,传统的短波系统正在向高速化、宽带化转变。现今短波通信带宽最高已扩展至24kHz,宽带短波通信正逐渐成为短波领域研究的热点。  本文深入研究最新颁发的美军标MIL-STD-188-110C,并将其与较早的美军标MIL-STD-188-110B进行了比较,研究其改进的部分。在此基础上,研究了MIL-STD-188-110c波形在宽带条件
学位
水下传感器网络是由具有声学通信与计算能力的传感器节点构成的网络系统,其是开展海洋数据监测处理的重要技术手段。相对常见的海洋通信系统,水下传感器网络具有基础设施简单、节点体积微小和设备成本低廉等优势,在海洋数据采集、环境监控、资源勘测、地震与海啸监控、海洋军事科学、辅助导航、水下机器人和AUV控制等方面具备广阔的应用前景。传统的水下传感器网络极大的依赖硬件基础架构,存在应用和服务受限,管控和维护困难
对称密码是密码科学的重点研究内容,被广泛应用于数字签名、电子支付等领域。近年来,随着无线技术的不断发展,物联网正在逐步深入到人们生活的各个领域中,但由于计算处理设备容量有限,传统的密码算法不能有效地保证其中的数据安全。轻量级对称密码正是因此应运而生,它通过改变算法中所使用的一些组件来保证数据安全,具有分组长度短、结构简单、资源消耗少等特点。然而,在实际应用中,轻量级对称密码算法的硬件载体可能会受到
随着科技和文化的发展,服装已不再是过去保暖的工具,它更是展现自我的方式。如今面对海量的服装数据,传统的服装推荐虽能达到良好的推荐效果,但由于过分依赖用户历史行为数据而经常出现冷启动和数据稀疏问题,同时因为忽略上下文环境,导致推荐结果达不到用户特定场景下的需求。因此,对服装个性化推荐的研究变得十分有意义。  知识图谱的本质是语义网络,它揭示了世间万物之间的关系。而服装本身自带了诸多属性和知识,但目前
学位
随着光伏发电提供的电量在世界总电量中的比重逐年增加,光伏发电在日常生活中所占的地位也越来越重要,这就要求光伏发电系统有更高的可靠性和安全性,同时,也对光伏发电系统中的主要电力设备——光伏逆变器的可靠性提出了更高的要求,一旦光伏逆变器发生故障而没有及时的诊断出来并将以处理,将会造成不可避免的重大损失。因而及时的故障诊断和定位是一个亟待解决的问题。基于对大量的运维数据的分析,可以发现实际运营中产生的光
糖尿病是一种常见的慢性病,据世卫组织发布的2016年公报统计,中国共有约1.1亿糖尿病患者和近4亿糖尿病前期人群。除了患者人数众多,糖尿病还是一种难以根治的终身性代谢性疾病,且其并发症很可能威胁到患者生命,所以需要尽早预防和及时控制。在糖尿病的临床治疗过程中,每名患者都需要不定期地多次去医院进行诊疗,治疗周期长、治愈较困难,导致了糖尿病专科领域的医生数量与患者数量严重失衡,因此,如果能够对糖尿病临