论文部分内容阅读
目的:确定估计个人卫生支出时可利用的辅助变量,以便构造有辅助变量的个人卫生支出二重抽样估计量;采用重复抽样的方法,分析抽样比例、目标变量与辅助变量的相关性对抽样效率的影响,选择合适的抽样比例和高效稳定的估计量估计陕西省2007年的人均个人卫生支出和人均收入;论证在国家卫生服务调查中运用二重抽样方法估计个人卫生支出的可行性;在没有现成个人卫生支出调查体系的情况下,探讨如何结合二重抽样和国家卫生服务调查获取较准确的个人卫生支出信息。方法:以陕西省第四次卫生服务调查的家庭一般情况调查数据为材料,以西部扩点地区的4161户样本为第一重样本,通过完全随机抽样产生第二重样本。以相对容易获得的家庭人均支出为辅助变量,构造二重抽样π估计量、比估计量和回归估计量,估计家庭人均收入及人均支出的各子支出项。通过重复抽样比较不同估计量在不同抽样比例下的估计效率,探索一个合适的二重样本抽样比例。采用偏差、相对偏差、标准误以及均方误差四个指标评价估计方法的估计效率,采用变异系数评价估计方法的稳定性。基于SAS软件的SURVEY过程编写重复抽样宏程序%Macro TwoPhase,实施重复抽样,重复次数设置为100,然后描述估计量和估计效率指标的重复抽样结果。结果:(1)家庭支出的无应答率最低,为1%;家庭人均收入以及其他人均支出子项目与家庭人均支出的相关性最高,分别为0.78、0.76、0.66、0.58、0.42、0.41、0.27、0.16。综合以上两点,选择家庭人均支出作为辅助变量构造二重抽样的均数和方差估计量。(2)一次抽样估计结果在抽样比例、相关性上没有表现出明显趋势。重复抽样结果显示,同一估计方法的抽样效率随抽样比例的增加而提高;同一抽样比例下,π估计的抽样效率最低,比估计和单辅助变量回归估计的抽样效率相近;对于比估计和回归估计,随着相关系数的增加,比估计和回归估计的效率逐渐提高,与π估计相比,估计效率优势逐渐增强。(3)实例分析中,抽样比例设置为0.4,二重样本对一重样本的估计均有效。陕西省2007年人均卫生支出,回归估计为540元。城乡差异较大,相差近300元;新农合农民与非新农合农民相差悬殊,非新农合为1097元,约为新农合农民的三倍;陕北地区比关中和陕南地区高,为676元。陕西省2007年人均收入为6043元。城乡人均收入差距较大,城市为8676元,农村为3325元。结论:(1)在实际应用中,应该结合调查变量与辅助变量的相关性以及调查的估计精度要求选择估计量和第二重样本的抽样比例。(2)国家卫生服务调查中应用二重抽样估计个人卫生支出的可行性得到论证。可在问卷设计阶段引入二重抽样设计,要求全部家庭回答家庭支出,而只要求部分家庭回答家庭收入和家庭支出的子项目,这样既可减少相关问题的应答者,又可以减少部分应答者的答题数目,达到降低时间成本、应答负担和回忆偏倚的目的。(3)可采用两种方式快捷有效获取个人卫生支出详细信息。对于国家卫生服务调查国家样本和西部扩点样本地区,可采用二重抽样方法对卫生服务调查样本进行二次抽样,开展个人卫生支出详细调查;对于非国家卫生服务调查样本地区,可借鉴二重抽样利用辅助信息的方法灵活地估算或独立开展调查。