论文部分内容阅读
目的:医疗卫生费用不断上涨,使人们的经济负担愈加沉重。加强对医疗费用分析,寻找主要影响因素,是制定合理控制医疗费用的有效途径。然而不同的分析工具会产生不同的结果,有必要对不同分析工具之间的差异进行比较。通过对辽宁省十家县医疗机构冠心病住院患者医疗费用进行分析,了解住院费用分布情况,运用多重线性回归、Logistic回归、BP-神经网络及支持向量机建模,对医院住院费用的主要影响因素进行分析,寻找最有效的医疗费用影响因素分析模型。在此基础上对有限的卫生资源进行合理地开发和利用,探讨控制医疗费用的增长对策。方法:通过文献研究法,对数据的类型和统计模型的适用条件进行研究。以辽宁省10家县医疗机构2014年1月至2014年12月期间冠心病患者的住院信息为例,采用K-means聚类法对冠心病费用进行分组和探讨,应用多重线性回归、Logistic回归、BP-神经网络及支持向量机这四种不同的数据分析方法进行影响因素分析,结合医疗费用的特点,寻找不同模型结果的差异并进行合理的阐述。结果:1.冠心病住院患者共计4528例,其中女性患者2843例,占62.8%,男性患者1685例,占37.2%;平均年龄67.7±11.0岁(25~95岁);年龄分段59~73岁人数最多,占49.01%;住院次数为1~3次的占93.04%;53.98%为急诊入院;住院天数为4~9天的占67.51%;41.50%患者有合并症;3.42%患者有并发症。2.不同医院之间,10家医疗机构中D医院患者最多,为1052人(占23.23%),G医院最少,为6人(占0.13%);性别方面,除了F医院男性占46.41%(71人),女性占53.59%(82人),其他9家医院男性占比在31.54%~39.95%之间,女性占比在60.05%~68.46%之间。不同医院之间冠心病类型、年龄分组、住院次数分组、入院途径、合并症、并发症情况均有统计学差异,P<0.001。3.冠心病平均费用5473.24±2839.60元,日均费用659.62±266.96元,平均住院天数8.7±3.9天。不同特征患者的住院费用均有统计学差异。总体来看,10家医院之间平均住院日、平均住院费用和日均费用有统计学差异,且差异较大。4.十家县医疗机构冠心病费用差异较大,H医院平均费用最高为6133.53元,I医院平均费用最低为4599.02元,其他七家医院平均费用在4623.56~5811.29之间,相差1187.73元;但高费用组各医院费用相差较大,高费用组平均费用介于7766.34~11940.81之间,相差4174.47元;低费用组费用介于3593.90~5151.21之间,相差1557.31元。5.数据不适合用多重线性回归方法,无法对其检验;Logistic回归分析的结果为:冠心病住院费用的影响因素包括住院天数、医疗机构、住院次数、冠心病类型、性别、年龄:性别;神经网络模型得出的影响因素依次是:住院天数、冠心病类型、医疗机构、住院次数、入院途径、并发症、年龄、性别、合并症。支持向量机得出的影响因素依次为:住院天数、冠心病类型、合并症、医疗机构、入院途径。并且,支持向量机、神经网络目标变量的准确度分别为87.39%,85.14%结论:十家医院的患者特征分布不同,不同医疗机构之间平均住院日、平均住院费用和日均费用均有统计学差异。Logistic回归分析与支持向量机及神经网络三种模型分析得出共有的影响因素为:住院天数、冠心病类型和医疗机构。其中,支持向量机分析得出的目标变量准确度高于神经网络模型,支持向量机筛选出的变量重要性排序也更加合理。支持向量机筛选出的影响因素依次为:住院天数、冠心病类型、合并症、机构名称、入院途径。此次研究中,支持向量机在住院费用影响因素分析中具有很大的优势,模型没有优劣之分,只是不同模型的适用条件不同。因此建议在对数据进行分析时,可以采用多种模型进行分析,根据数据特点选取最合适的模型。