【摘 要】
:
电子病历数据是对患者就诊全过程的客观记录,包含大量与患者病情密切相关临床信息,为发展智能临床决策辅助提供了数据资源。然而,真实电子病历中普遍存在着数据稀疏、数据质量低下等问题,难以直接使用。而且电子病历中的文本数据也蕴含着丰富的临床信息,但是在临床决策辅助相关研究中还未被充分利用。本文将考虑电子病历中的各种特征数据,以机器学习与数据挖掘相关技术为手段,研究医疗决策辅助的相关方法。本文构建了一种基于
论文部分内容阅读
电子病历数据是对患者就诊全过程的客观记录,包含大量与患者病情密切相关临床信息,为发展智能临床决策辅助提供了数据资源。然而,真实电子病历中普遍存在着数据稀疏、数据质量低下等问题,难以直接使用。而且电子病历中的文本数据也蕴含着丰富的临床信息,但是在临床决策辅助相关研究中还未被充分利用。本文将考虑电子病历中的各种特征数据,以机器学习与数据挖掘相关技术为手段,研究医疗决策辅助的相关方法。本文构建了一种基于患者间相似性的个体化住院时长预测方法,该方法是由数据处理、患者相似性度量、特征选择、预测模型、模型解释在内的多种算法构成的一个有机整体。主要研究工作包括:(1)电子病历数据清洗与结构化方法研究。设计一系列数据清洗算法实现对质量低下的结构化电子病历数据进行规范;针对非结构化文本数据提出基于字符粒度的Doc2vec将其转化为向量表示。通过本文的数据处理方法后,实现将原始异构混杂的电子病历数据标准化为可直接用于后续使用的数据矩阵。(2)患者临床相似性度量方法研究。本文提出一种更全面的患者临床相似性度量方法,充分利用电子病历中的各种患者特征数据表示患者病情,并对这些特征间的距离进行有效评估,进而实现对任意两两患者病情间的相似度计算。(3)基于患者相似性的住院时长预测算法研究。基于所提出的相似性度量方法,实现从相似样本队列中为每个患者建立个性化预测模型。此外,也通过特征选择技术对影响预测目标的关键特征进行识别,采用随机森林、XGBoost、light GBM以及决策树这些监督学习技术学习预测模型。最后,为了增强对个体化预测模型决策结果的理解,本文研究应用SHAP可视化方法增强对模型特征层面以及个体决策结果层面的解释性。本文在真实的肝硬化腹水患者电子病历数据上,对所提出的算法进行应用,并进行多组数据实验对其性能进行评估。主要结果表明:(1)本研究中识别的15个关键特征,可以用于肝硬化腹水患者的住院时长预测,用于最终模型的建立。(2)本文基于患者相似性构建的住院时长预测模型,能够表现出更好的稳定性和效果,也表明了本文提出的患者相似性度量方法在个性化诊疗决策辅助应用中的有效性。(3)构建的四个个体化的预测模型的表现能够在一定程度上优于通用模型。(4)通过SHAP对模型特征解释发现,肝硬化腹水患者的低“前白蛋白”水平与更长的住院时长最相关。
其他文献
随着电力电子技术的发展,传统的硅器件已经无法满足一些高温、高压、高功率密度等应用场合的性能要求,宽禁带半导体器件应运而生。SiC MOSFET作为宽禁带半导体器件的典型代表,具有耐高温、耐高压、开关速度快、导通损耗低等优点,是功率器件市场的研究热点。相比于同等级的Si IGBT,SiC MOSFET的芯片面积更小,电流密度也更大,所以SiC MOSFET的短路耐受时间比Si IGBT的要短的多,只
掺铥光纤激光器(Thulium-Doped Fiber Laser,TDFL)具有稳定性优良、结构灵活特性,且输出位于人眼安全的2.0μm波段的激光,单纵模(Single Longitudinal Mode,SLM)TDFL在军事、医疗、雷达、光通信及传感等领域有广阔的应用前景,波长可切换光纤激光器因其输出激光波长的可调性和灵活性而在波分复用系统、传感网络和光通信网络中有重要应用。利用法布里-珀罗
高铁是我国科学技术自主创新的一面旗帜,其在速度、可靠性、舒适度等方面不断地提高。IGBT作为高铁中牵引变流器的关键器件,其可靠性与列车的安全运行有着密切的联系。IGBT伴随着列车运行会承受频繁的电气应力、机械应力,以及温度应力等,研究IGBT在列车运行过程中的损耗热特性与电气耐受特性,可以对牵引传动系统可靠性的提升以及列车运行控制的优化提供一定的理论指导。论文首先介绍了高速列车的运行特性和牵引变流
少模光纤通信作为一种提高通信系统传输容量的潜在方案而备受关注。少模光纤通信系统以光纤中相互正交的信号模式作为独立的通信信道进行信息的传输,实现通信系统传输容量的大幅提升。少模掺铒光纤放大器是少模光纤通信系统中至关重要的中继放大器件,利用均匀掺铒的少模光纤放大器对系统中的模分复用信号进行放大时,信号会产生较大的模式增益差,导致少模光纤通信系统传输容量的急剧下降。因此需要对少模掺铒光纤放大器进行增益均
半导体晶圆制造领域对工件表面的加工要求极高,尤其是针对于新一代的化合物半导体材料如碳化硅(Si C)、砷化镓(Ga As)、氮化镓(Ga N)等,使得实现高表面质量、高平坦度的加工难度不断增加。磁流变抛光方法应用于半导体晶圆加工过程,能获得更高的表面加工质量与加工效率。然而磁流变平面抛光过程中,抛光液中的铁磁颗粒和磨粒由于磁场与工件的交互作用发生团聚形成大尺寸颗粒,磁流变液的流变特性会使得团聚大颗
IGBT(Insulated Gate Bipolar Transistor)是一种电压控制型功率器件,具有通态压降低、开关速度高、通流能力强等优点,在轨道交通、可再生能源和工业传动等领域中应用广泛。随着半导体制造工艺的发展,主流商品IGBT模块的功率密度有了显著的提高,通流耐压能力已经达到6500V/1000A,4500V/3000A水平,基本满足一般高压大功率场合应用。在某些大功率或者高功率密
光纤模式选择耦合器(Mode Selective Coupler,MSC)是一种可以实现不同光纤横模转换的新型光纤耦合器,可以用于模分复用光纤通信系统中的模式复用/解复用,也可以用于光纤激光器中产生特定高阶横模激光。近年来随着模分复用光纤通信技术、光场调控及应用技术等的发展,光纤MSC获得了较多的关注,相关的分析理论、制造工艺等日趋完善,有力支撑和推动了相关器件和系统的发展。本论文在前人研究的基础
产品分销的零售商选择是供应链交易活动的重要组成部分。公司的成败取决于配送中心的性质和特点。当供应链变得更加资本主义化时,配送中心在决策时需要意识到边界的变化。候选人的选择是基于既定的规范的,这些规范可以在公司和集团之间重叠,候选人的特征作重要性是决定决策过程的选择标准这项研究的主要目标是在拉合尔附近的贫民窟地区找到新的医疗设施中心,在那里人们没有任何廉价和快捷的设施来购买治疗自然疾病的药物。本研究
钢轨内部损伤会导致钢轨断裂而发生严重的事故,因此及时发现钢轨内部裂纹,对于铁路维护有重要意义。目前国内外在铁路现场使用的钢轨探伤车均是在天窗时间进行探测,且钢轨轨底角存在检测盲区,无法实现钢轨全截面在线监测。超声导波衰减小适用于长距离探测,但由于钢轨较为复杂的几何结构,使超声导波固有的多模态性和频散性更为显著,且钢轨不同区域对不同模态的敏感性不同,无法使用某种单一模态进行监测。本论文在分析超声导波
有机-无机杂化钙钛矿由于其高载流子迁移率、高光致发光量子产率(PLQY)、可调节带隙和窄发射宽度等特性而成为高性能发光二极管(LED)的极佳候选材料。然而钙钛矿薄膜粗糙的表面形貌使缺陷密度大幅增加,低激子结合能增加了激子离化的几率,导致发光效率严重下降。为了获得高性能的钙钛矿发光二极管(Pe LED),需要改善钙钛矿薄膜形貌并提升激子结合能。本论文详细地研究了MAPb Br3中过量MA离子和掺杂C