论文部分内容阅读
随着医疗信息的电子化和人工智能的发展,医疗自诊断系统逐渐引起人们的广泛关注。现有工作中,研究人员基于多种机器学习模型训练电子病历(Electronic medical records,EMR),通过调整模型结构得到更好的疾病诊断结果。然而,这些方法只关注了模型表现是否良好,忽略了实际应用中患者无法一次性准确地提供自诊断模型需要的信息。真实问诊中,患者往往在与医生的数次问答中完成对自身病情地全面描述。为模拟这一过程,本文构建了一种可交互式的智能诊断模型。同时,机器学习的“黑盒性”限制了其在医疗领域的应用,医疗诊断模型的可解释方法研究十分必要。因此,本文提出一个基于医疗知识图谱和深度强化学习的、具备可解释性的医疗自诊断系统DKDR(Disease diagnosis system by dint of Knowledge graph and Deep Reinforcement learning),该系统的主要内容有:(1)实现疾病智能诊断:使用机器学习分类算法诊断疾病。本文对比了多种分类算法,在真实医疗数据集MIMIC-III和电子病历生成器Synthea生成病历上进行实验,选择表现较好的多层感知器(Multilayer Perceptron,MLP)与卷积神经网络(Convolutional Neural Network,CNN)作为疾病智能诊断算法。(2)实现交互式的疾病智能诊断:构建医疗知识图谱与用户交互,并在疾病智能诊断算法MLP/CNN之上引入强化学习算法Q-learning提高疾病诊断的准确率。首先,基于Scrapy爬虫框架和Neo4j图数据库构建医疗知识图谱,该图谱帮助用户完善病情描述,实现与用户的交互。其次,结合Q-learning算法与MLP/CNN算法诊断疾病,提高疾病诊断的准确率,最佳的疾病诊断准确率达到了91%。(3)实现疾病智能诊断的可解释性:基于可视化敏感性分析构建解释模型。分别使用散点图、热图、雷达图呈现电子病历数据特征,观察不同特征对于疾病的影响。通过对该影响的分析,重新进行诊断模块实验,并观察模型表现。经过分析与改进,模型对肺炎的诊断准确率提高了3个百分点。可视化敏感性分析帮助研究人员和用户更好地理解模型,增强人们对医疗自诊断系统的信任。