论文部分内容阅读
在模型当中,人们比较喜欢研究参数模型,主要是因为参数模型具有简单性、解释性以及有效性。但是,如果我们给出的模型假设不正确的话,就会出现错误的结果。为了减少模型的偏差,具有灵活性的非参数模型越来越多的受到人们的青睐。但是当协变量维数比较高的时候,就会出现“维数祸根”问题。因此,介于参数与非参数模型之间的半参数模型越来越多的受到人们的关注。这主要是因为半参数模型不仅有参数模型的可解释性,还有非参数模型的灵活性。其中可加部分线性模型就是一种常见的半参数模型。在实际的生活中,在许多像市场调查等领域中,许多被调查的人并不想泄露自己的信息,就会导致在做调查的时候存在缺失数据的情况。在这种情况下,标准的统计推断已经不能够很好的对数据进行统计分析。因此,许多学者开始着手研究如何利用观测到的数据进行统计研究。对于处理缺失数据的办法中,人们首先能够想到的办法就是去掉没有观测到的数据,利用能够观测到的数据进行统计分析,但是这种方法有一个缺点,就是统计分析得到的结果是有偏的。因此,另外一种比较有效的方法,逆概率加权(IPW)方法越来越多的被人们所使用。本文就是在协变量缺失下基于逆概率加权的方法对可加部分线性模型进行了统计推断。本文共分成四章,第一章我们首先介绍了缺失数据、分位数回归、经验似然以及可加部分线性模型相关的基础知识以及目前的研究现状;第二章和第三章是本文的主要工作,第四章是对本文的总结以及今后的展望。第二章基于Ben sherwood(2016)[5]对于协变量缺失下可加部分线性模型参数的单个分位数估计,我们给出协变量缺失下可加部分线性模型的加权分位数平均估计,主要给出了当选择概率πi已知,有参数结构以及非参数结构下参数β的加权分位数平均估计,分别为:(?),并证明了参数的渐近正态分布为:(?)除此之外,在第二章第四部分我们还给出了数值模拟和数据分析,通过数值模拟我们可以得出我们所提出的方法的效果比加权复合分位数(WCQR)、加权分位数(WQR)以及加权最小二乘(WLS)估计的效果要好。第三章我们主要给出了协变量缺失下可加部分线性模型中参数的逆概率加权的最小二乘估计和经验似然推断,我们给出了参数的逆概率加权的最小二乘估计的渐近正态分布为:(?)根据其渐近正态结果可以给出相应的置信区间,但是利用正态分布构造出的置信区间,需要先估计∑1和∑2,因此得到的置信区间精确度不高,所以我们考虑β的经验似然置信区间,通过构造参数屁的估计方程,进而得到其经验似然比统计量,并在一定的条件下证明了该统计量的渐近分布为标准卡方分布,从而在不用构造枢轴量的前提下,很方便的得到了参数/β的置信区间,具体的说参数的置信域为:(?)