论文部分内容阅读
许多科学研究领域的一个基本工作是研究因素变量(协变量)对某些感兴趣变量(反映变量)的影响,回归模型为我们处理这类问题提供了一个有力的工具,由此建立起了参数、半参数和非参数回归模型的推断理论。这里我们设 X 和 T 为协变量,Y 为反映变量,它们的维数分别为p、1 和 1,为指示变量。在实践中,我们经常得到如下不完全样本:
(1) 样本,,其中、都有缺失。当缺失时,否则;当缺失时,否则,并且它们的缺失满足:,,即X,Y的缺失是完全随机缺失(MCAR)的。
(2) 样本,,其中,为完全样本,有缺失,当=0时,缺失,否则不缺失,并且的缺失满足:
,即Y的缺失是随机缺失(MAR)的。
在这些有缺失样本的情形下通常的推断理论就不能直接应用了。
处理不完全样本的基本方法是对那些缺失值进行补足,然后把它们作为完全样本,按照标准的统计方法来推断,本文采用的数据补足方法是利用给定的回归模型对缺失数据进行回归补足。
本文在样本(1)下讨论如下线性回归模型,在适当条件下得到了反映变量Y的均值的估计,并且获得其调整的经验似然统计量的渐近分布(定理(1.1),其中为参数真值),由此可直接导出的经验似然置信区间,数据模拟表明此置信区间有较好的精度。本文在样本(2)下讨论如下部分线性模型,,在适当条件下得到了调整的经验似然统计量的渐近分布(定理(2.1),其中为参数真值),由此可直接导出参数的的经验似然置信域。主要结论如下:
定理1.1 若为真参数,则依分布收敛于。
在部分线性模型中为得到调整的经验似然统计量的渐近分布,我们用非参数回归函数核估计的方法对部分线性模型的非参数部分进行估计,为此我们取核函数为,核窗宽。首先给出如下假设条件:
(I)在[0,1]上有连续密度r(t), 且;
(ii)对,记,设g和均满足1阶Lipshitz条件;
(iii)用表示中欧式范数,设且为正定阵;
(iv);
(v) 存在常数,以及使得,且在上是有界变差函数;
(vi);
(vii) 记设其中 ,设为正定阵,其中;
(viii) ,。
定理2.1 假设条件(I)-(viii)成立,则当时,。