论文部分内容阅读
在实际试验研究中,估计和评价某种处理效应的作用情况,采用随机对照试验(randomized controlled trial,RCT)无疑是最理想的。随机对照试验是实际试验统计分析的基础,但随机对照试验的应用也受到一些限制,如研究费用成本高、实际操作比较困难以及不适用于周期很长的研究等这都限制了随机对照试验的应用。而非随机化研究同样存在一定局限性,如在于预后因素在组间分布的不均衡性以及各种偏倚的存在,会产生有偏的处理效应估计。统计研究中通常使用多元分析模型、分层法、匹配法等方法来控制选择性偏倚。但这三种方法都不适用于混杂因素较多的情况。倾向得分是非随机化研究中控制偏倚的一种新方法。近年来,倾向得分方法以其研究步骤标准化程度高、易于理解等优点而备受研究者的关注,并广泛的应用于各领域的非随机化研究中。倾向得分的概念是由Rubin和Rosenbaum在1983年首次提出的,其概念是在给定一组协变量前提下,将任意一个研究对象分配到处理组或者对照组的条件概率。倾向得分法的优点是可以将多个协变量共同作用的结果表示出来,倾向得分达到控制选择性偏倚的目的是通过调整处理组和对照组之间的协变量均衡性来达到的。当前,倾向得分法主要应用于两分组资料的研究,对于多分组资料领域还未普及,其原因是多分组资料的应用中还有一些关键问题尚待解决,比如匹配法中卡钳值的选择问题、如何检验灵敏度以及评价均衡性的方法等。本文采用倾向得分匹配法运用到种烟对农民的收入影响的研究中,整理数据并根据数据类型选择合适的模型及纳入的协变量后,计算出倾向得分,再进一步研究。在研究中,我们采用Probit模型,首先通过逐步引进农户家庭特征变量来估算倾向得分,检查种植烟叶户和非种烟户倾向得分平衡性以及模型的Pseudo R值,选择满足平衡性要求且Pseudo R值最大的变量组合用于最终倾向得分估算。Probit模型估算的Pseudo R值在2007至2010年分别为0.047、0.062、0.052和0.054,变量的选择满足平衡性要求。Probit模型估算说明了个变量对于农户选择种植烟草的影响。从具体的显著性影响看,在这4个调查年份中,农户家庭劳动力比重越小,种植烟叶的可能性越大;农户山地面积比重越大越可能选择种植烟草;农户家庭人数越多,选择种植烟草的可能性越大。采用倾向得分匹配法评估种植烟叶对农户收入的效应,分析发现,种植烟叶对农户收入的增加具有稳健的正向效应。利用倾向得分匹配法对农户种植烟叶的评估有别于利用描述性统计分析的结果。第一,两种分析方法所考察的种植效应递减在趋势上存在差别。从种烟户和非种烟户收入比较的描述性统计分析中我们可以知道:种烟户收入与非种烟户收入的差异(倍数)在2007至2010年这4个考察年间呈现出的趋势变化比较大(从1.16到1.44再到1.18,最后到1.29);而利用倾向得分匹配法的分析则能看出种烟效应总体呈现缓慢的递增趋势(从1.041到0.997,再到1.248,最后到1.387)。第二,传统的描述性统计分析会高估种植烟叶对农户收入的效应。在种植烟叶效应评估方法上,本文采用不同的匹配算法评估种烟对农户收入的效应。不同匹配算法所得的效应大小是有差别的,其原因在于不同的匹配方法产生不同的共同支撑区域,从而引起了不同数量的样本农户损失和不同的匹配质量。