论文部分内容阅读
目的:本文旨在对实施新型农村合作医疗试点后地区的现场追踪调查数据运用决策树和Logistic回归分析相结合的数据挖掘方法进行数据的分析,以探讨决策树这一数据分析方法在新型农村合作医疗制度实施效果相关因素研究中实际应用的可行性、具体实施方法及其现实的应用价值。方法:本项研究数据为笔者2006年对江西省首批试点新农合的三个县进行的新农合实施效果评估的追踪调查,采用的是典型调查和分层整群随机抽样相结合的方法;通过对数据的整理,建立本项分析目标数据库,借助SAS软件中的Enterprise Miner模块,依据SEMMA数据挖掘理论建立了实施新农合后地区农民参合意愿分析的决策树和Logistic回归分析模型、农民住院就诊单位选择影响因素决策树和Multinomial Logistic回归分析模型,并对参合意愿树模型和回归模型的拟合情况及其结果进行比较分析,利用效果较佳的树模型进行参合意愿的分析;对于选择就诊单位影响因素的分析,联合拟合较佳的树模型以及回归模型进行分析,从而科学的探讨影响新农合试点后地区农民住院就诊选择的因素。结果:对于农民参合意愿分析效果最佳的树模型为CART树模型,其分析结果提示影响参合意愿的因素为:对报销公平的认识、费用负担方式、报销经办人员的服务态度、文化程度、是否知晓别人报销、是否知晓张榜公布、对医疗质量的评价、距最近医疗点的距离。而多因素Logistic回归模型分析结果入选因素为:对报销公平的认识、费用负担方式、报销经办人员的服务态度、是否知晓别人报销。最佳树模型筛选的变量涵盖了回归模型入选的解释变量。通过对树型图和产生的分类规则的分析揭示:报销公平性的认识对于不同费用负担方式的农民,在其明年参合意愿的表达过程中,影响效果是不同的。对于农民住院就诊单位选择分析效果最佳的树模型亦是CART树模型,同时研究中CART树和单因素回归分析均将12个解释变量选入了模型;结合这些变量进行的多变量多分类Logistic回归结果提示费用负担方式和性别被剔出了最终的回归方程中;最后研究结合树分析提供的变量重要性值和回归分析结果提供的参数估计值进行分析提示影响农民就诊的主要因素是患病的类型,其次是文化程度和职业状况,新农合的各级医疗机构补偿比梯度策略并没有对农民住院单位的选择起到科学合理调配的作用,农民自身文化程度高易掌握一定的医学知识对于合理的就医是一个正向的促进因素,同时切实做好外出务工农民的就医工作对于新农合的发展和稳定是值得深入研究内容。结论:通过本课题将决策树和回归两种数据分析方法结合数据实例进行的研究,完成了对于试点区农民参合意愿以及住院就医单位选择影响因素的分析,并对这个数据分析的过程作出了详细的阐述。通过比较这两种分析方法,发现两者在数据的分析过程中各有其优势,在实际数据的分析过程中最佳的方法就是将两者的优点有机的结合起来,最大限度的发挥两种方法的优越性,而不应拘泥于讨论两者的优劣。