论文部分内容阅读
目的描述急性心肌梗死(acute myocardial infarction,AMI)住院费用的基本构成情况,利用多种数据挖掘工具构建AMI患者住院费用分类模型。分析影响AMI患者住院费用的主要因素,寻找控制AMI住院费用的有效方法。方法本研究资料来源于厦门大学附属心血管病医院2017年1月1日至2017年12月31日的住院病人,选择诊断为AMI的病例,经过数据清洗后共925例样本。对AMI患者住院费用及其构成进行描述性分析,对性别、年龄、是否手术和医疗付费方式等影响因素进行单因素分析。通过python3.7.1软件利用K-means聚类对住院费用进行离散化,采用支持向量机、人工神经网络、决策树和随机森林算法拟合模型,分析AMI患者住院费用的影响因素。结果AMI住院费用构成情况分析显示:单项费用中,构成比排名是:耗材费(53.82%)、治疗费(19.0%)、诊断费(14.75%)、药费(8.2%)和医疗服务费(4.1%)。单因素分析显示:男性、进行手术、40-60岁与60-80岁年龄分段的AMI患者住院费用均较高。住院费用随住院天数递增而增加,当AMI患者伴随并发症时,住院费用更高。有序logistic回归分析结果显示性别、住院天数与是否手术对因变量住院费用有显著影响。从OR值可以看出,在排除其它因素影响的情况下,与女性AMI患者相比,男性AMI患者住院费用增加一个等级可能性更高,后者是前者的1.93倍;住院天数每增加一天,AMJI患者住院费用增加一个等级的危险度为1.23倍;手术患者与非手术患者相比,AMI患者住院费用增加一个等级的危险度为210.61倍。本研究中,将AMI患者住院费用分成3类时效果最佳,第一类聚类中心为20251.95元,住院费用范围为1533-41211元;第二类聚类中心为57976.39元,住院费用范围为41477-89321元;第三类聚类中心为117865.86元,住院费用范围为89576-196373元。利用离散化后的的住院费用作为目标变量,单因素分析结果有意义的特征作为预测因子构建AMI患者住院费用预测模型,结果显示预测正确率最高的模型是支持向量机(99.64%),接着是随机森林(99.25%)、人工神经网络(93.0%)、logistic回归(73.4%)和决策树(72.33%)。数据挖掘算法较传统回归模型预测效果更好。结论在本研究中,耗材费占住院费用的比例较高,主要是因为经皮冠脉介入治疗(percutaneous coronary intervention,PCI)是治疗AMI的主要手段且应用日益广泛,其中包含了高额的支架费用。因此,加强高额耗材的管理、降低支架费用非常关键。住院天数越长,住院费用越高,长期住院会不断产生诊断、检查与医疗服务费用,合理控制住院天数有助于缓解疾病经济负担。住院费用同样与合并症等因素有关,当患者有多种合并症时,病情往往更为复杂和严重,加强慢性病的预防健康教育工作有助于降低疾病经济负担。此外,从模型分类效果而言。在logistic回归、支持向量机、人工神经网络、决策树和随机森林五种模型中,支持向量机与随机森林模型有较高的预测能力,数据挖掘算法较传统回归模型预测效果更好。