论文部分内容阅读
本文主要研究一类纵向数据,包括高维纵向数据,纵向测量误差数据等情形下半参数回归模型的有效经验似然推断和变量选择问题.纵向数据是指对同一个个体或者受试单位在不同时间进行重复观测得到的数据.纵向数据的特点是组内数据相关而组间数据是独立的.因此,对纵向数据分析的难点是如何充分利用它的组内相关性的特点来提高统计推断的效率.近年来,对纵向数据的研究已经引起了国内外统计学者的广泛关注.半参数回归模型是既含有参数分量,又含有非参数分量,综合了参数回归模型和非参数回归模型的优点,充分利用了数据的信息,具有更大的灵活性,并具有较强的解释能力.因此,研究纵向数据半参数回归模型的统计推断具有重要的理论意义和实用价值.基于二次推断函数和广义估计方程等方法,本文研究了一类纵向数据半参数回归模型的统计推断问题,包括广义线性模型,部分线性模型和变系数部分线性模型等统计模型的经验似然推断和变量选择问题.具体地,本文的研究内容有以下几个方面.对纵向数据广义线性模型,利用广义估计方程和二次推断函数方法基于工作相关矩阵提出了一种广义经验似然方法.该方法可以有效地处理纵向数据组内相关性,并且不需要估计工作相关矩阵中的讨厌参数.在适当的条件下,证明了所提出的广义经验似然比统计量依分布收敛于标准卡方分布.进一步,将该方法推广应用到纵向数据部分线性模型,构造了模型中回归参数的广义经验对数似然比统计量和基准函数的经验对数似然比统计量,讨论了所提出经验对数似然比统计量的渐近性质,模拟研究表明所提出方法具有较好的有限样本性质.对纵向数据变系数部分线性模型,基于基函数逼近和惩罚二次推断函数方法,我们对该模型提出了一种变量选择方法.该变量选择方法可以同时选择模型中的参数分量和非参数分量,并且得到的非参数估计达到了最优的收敛速度.在选取适当调整参数下,证明了变量选择的相合性和渐近正态性.另外,我们也给出了同时进行变量选择和估计过程的迭代算法,也讨论了如何选择惩罚函数中的调整参数,进一步给出了基于BIC准则选择调整参数的相合性.最后通过数据模拟和实例分析表明所提出的变量选择方法是有效的.对纵向数据测量误差模型,首先在线性EV模型下,基于二次推断函数和压缩估计提出了一种纠偏的变量选择方法.这个变量选择方法不需要假定测量误差的分布.在选择适当调整参数下,证明了变量选择方法是相合的,回归系数的估计具有Oracle性质.进一步,我们将这种变量选择方法应用到部分线性EV模型的变量选择,其中非参数函数使用核估计.这个方法不仅考虑到纵向数据的组内相关性的特点,而且还考虑了工作相关矩阵对测量误差纠偏项的影响.另外它不需要工作相关矩阵中讨厌参数的估计.在一些正则条件下,证明了惩罚二次推断函数估计具有相合性和渐近正态性.随机模拟结果也表明了所提出的变量选择方法是有效的.最后,对高维纵向数据,在部分线性模型下提出了一种自动地变量选择方法,称之为光滑域广义估计方程变量选择.这种变量选择方法可以自动地把不显著变量系数压缩为0,同时得到重要变量的系数估计.我们提出的变量选择方法是基于广义估计方程,它能够处理数据组内相关性,并且不像传统的惩罚方法,它不涉及惩罚函数凸最优化的问题,也计算方便.进一步,在适当的正则条件下,证明了在“大n,发散p”框架下变量选择的相合性和渐近正态性.随机模拟结果表明所提出方法具有较好的有限样本性质.然而,我们知道广义估计方程方法涉及工作相关矩阵中讨厌参数的估计,讨厌参数错误估计会降低回归参数估计的精度.为此,我们基于二次推断函数,在高维纵向数据线性回归模型下,探究了一种采用基函数逼近工作相关矩阵的自动的变量选择方法.这个方法结合了光滑域估计方程和二次推断函数方法,更有效地考虑了纵向数据的组内相关性.通过模拟研究验证了这种自动变量选择方法是有效的.