【摘 要】
:
近年来,人口的老龄化进程加剧,随之而来的医疗资源也十分短缺。同时,人工智能技术已经被广泛地应用于包括商业、工业以及医疗等现实生活之中。强化学习(Reinforcement Learni
论文部分内容阅读
近年来,人口的老龄化进程加剧,随之而来的医疗资源也十分短缺。同时,人工智能技术已经被广泛地应用于包括商业、工业以及医疗等现实生活之中。强化学习(Reinforcement Learning,RL)作为当代人工智能的核心技术之一,在医疗重症室智能决策的应用中取得了长足的发展,但当前研究仍具有一些局限性。强化学习包含三个关键性因素,分别是状态、动作、奖励值函数,其中,一个合理的奖励值函数需要被预先定义,这可能严重依赖于医生的临床经验,缺乏一定的普适性。此外,传统强化学习最终的目标是最大化长期累计的奖励值,学习过程中基于试错的探索行为,可能会对病人造成不利的影响。脓毒症被定义为能威胁人类生命的急性器官功能障碍,是重症监护室中最主要的病症之一,也是医院病人死亡的主要原因,但其最佳治疗策略尚未明确。近年来,目睹了强化学习(RL)方法在脓毒症治疗中得到了成功应用,实现了比临床医生更为有效的治疗策略。为确保此类应用,应根据医疗健康护理的专业知识来预先定义奖励值函数,以明确治疗目的。然而,由于缺乏对脓毒症本身的了解,在脓毒症治疗过程中的奖励值定义仍然存在较多争议,缺乏统一标准,因此本文利用了深度逆强化学习(Deep Inverse Reinforcement Learning,DIRL)来解决脓毒症治疗中奖励值的学习问题,并给出脓毒症的最佳治疗策略,以及基于历史数据的策略性能评估方法。在本文中,我们提出了一种基于深度逆强化学习最小树(Deep Inverse Reinforcement Learning-Mini Tree,DIRL-MT)模型,使用回顾性真实医学数据从一组可能的最佳治疗轨迹中推断出最佳奖励函数。在模型中,最小树MT通过监督学习方式挖掘影响脓毒症死亡率的关键特征,而深度逆强化学习(DIRL)根据这些特征的权重推断出完整的奖励函数。本文提出了两种治疗脓毒症患者的新特征,并将它们与脓毒症以往定义的诊断标准相结合,以获得脓毒症治疗的最佳策略。此外,本文提出了基于对偶权重(Dueling Weight,DW)的异策略评估(off-policy evaluation,OPE)方法,实现了基于历史数据的更为鲁棒和可靠的策略性能评估。实验结果表明,本文提出的DW异策略评估方法较现有的异策略评估方法更具有有效。根据脓毒症患者的历史数据评估本文的算法,我们发现本文的模型可以将临床策略患者的总体死亡率降低3.3%。本文的模型所学到的治疗策略可用于帮助重症监护临床医生进行医疗决策,并提高患者生存的可能性。
其他文献
随着改革开放的深入发展,我国经济、科技日益现代化,人民生活水平不断提高,尤其是随着大众传媒的异军突起,各种全新价值观念以及新锐生活方式的流行,使得人们的文化生活日益丰富多彩,伴随而来的多元文化并存也已经成为一种不可阻挡的趋势,将高校大学生裹挟在其中,各种偶像的流行,使得偶像崇拜现象越来越成为一种不容忽视的文化现象,影响着年轻的一代,尤其是大学生群体。高校思想政治教育作为高校学生思想教育的主阵地、主
图像是数字信息化时代重要的信息传递的载体。然而,受限于图像采集设备的成本、成像模态本身的技术瓶颈以及信息传输条件,人们在现实生活中所采集的图像通常分辨率较低且模糊
为了贯彻新时期好干部标准,改善选人用人状况,用于分析用人导向的民主测评系统研究应用日趋活跃。本文以民主测评系统为研究课题,重点研究了Flex技术、Java技术以及人脸识别
开发新的能源储存技术可以有效应对化石燃料大量使用所带来的环境污染和全球变暖问题。热能存储技术的快速发展为提升能源利用效率、解决能源危机和污染问题提供了新的途径。
在全球信息化时代,国家间的英语交流,已不仅限于阅读与写作,听、说与理解成为当下英语学习过程中的内核。而从小学,初中的启蒙式英语到高中的全面学习,再面向大学时期的开放式学习的过程当中,高中阶段是学生巩固基础,培养学习习惯的重要时期。因而在此过程中,要通过英语教学来渗透学生文化感情,培养跨文化意识,提高跨文化能力是亟需关切的问题。目前高中英语教学过程中,由于受到升学率影响,重读写,轻听说,重工具轻人文
听、说、读、写是英语学习的四大技能。然而,在目前的高中英语教学中,写作被高中生认为是最复杂,最难掌握的,也是其英语最薄弱的环节。笔者在教学中发现,学生英语写作中主要存在三种错误:词汇、语法和语篇错误,其中语篇错误是最难纠正的。此外,在日常写作教学中,教师主要对学生作文里的单词和句子语法错误的纠正。然而,词汇和语法不能完全体现学生的英语写作,文章的篇章结构和谋篇布局才更具有代表性和典型性。因此,本研
大肠杆菌(Escherichia coli,E.coli)是导致畜禽感染的主要致病菌之一。近年来,由乳腺致病性大肠杆菌(mammary pathogenic Escherichia coli,MPEC)和禽致病性大肠杆菌(avian pathog
城市轨道交通的不断发展,对安全运行提出了更高的要求,城市轨道交通环境感知方面的研究成为了重中之重。与此同时,环境感知在汽车智能辅助驾驶系统的成功应用案例,为城市轨道交通障碍物检测问题提供了新的思路和解决途径。本论文围绕轨道交通环境感知以及轨道前方障碍物检测开展了深入的研究,将实例分割网络引入到障碍物检测的问题中,选用了基于Mask R-CNN实例分割网络的环境感知方法来解决城市轨道交通障碍物检测的
为破解目前留用地零散破碎、利用效益低的困境,盘活农村集体留用地资源和提高被征地农民生活水平,探讨了被征地农民集中留地安置意愿与交易费用认知的关系内涵并构建了一个分
本论文在对岩心观察、分析以及描述的基础上,综合运用地震沉积学、石油天然气地质学以及层序地层学等相关理论和方法,通过对测井、录井、地震、岩心以及区域地质资料的综合分