论文部分内容阅读
处理离散随机变量的一种重要的模型——广义线性模型,它对各领域的统计分析具有重大意义,能够克服一般线性模型存在的不足.本文所研究的高维纵向数据的广义估计方程(GEE)以及惩罚广义估计方程(PGEE)均是在广义线性模型的基础上进行了扩展,是一种处理纵向数据的统计模型,它在现实生活中的应用日趋广泛,并随着科技的不断进步,收集到的数据种类越来越多,结构也就随之越来越复杂,这样的数据常出现在生物医学领域.因此,本文研究的高维纵向数据的(PGEE)GEE不管是理论还是实践都有极其重要的作用.一般线性模型只能拟合一些特殊的资料,而广义线性模型则不一样,它具有较大的灵活性,运用也日趋广泛.Wang(The Annals of Statistics,39(1):389-417)在较弱的条件下证明了经典Logit模型的广义估计方程相关系数矩阵估计的相合性.基于此,本文在较弱的条件下,证明了计数数据的广义估计方程相关系数矩阵估计的相合性,对文献中的相应结果进行了推广.Wang et al.(Biometrics,68(2):353-360)在较弱条件下证明了经典Logit模型惩罚广义估计方程估计的渐近性质.而对于两阶段Logit模型,其联系函数(link)已不仅仅是自然联系函数,这种模型将所有观测目标根据状态分成两类,主要分为两个步骤:第一步,将3个状态的观测数据分成两类;第二步,再在其中每类中确定其所处的状态;如药物对病人的效果分别为“好”,“未改变”,“坏”,其中“坏”分为一个类别,“未改变”,“好”分为另一个类别;其次,对GEE加一个SCAD惩罚,因为此惩罚具有oracle性质,这样得到的预测效果和真实模型高度一致,其目的是进行变量选择时,剔除冗余变量,以提高模型在实践运用中的精度,从而建立两阶段Logit模型的PGEE.最后,本文运用Bernstein’s不等式和其他定理、性质在更弱条件下证明了两阶段Logit模型的PGEE估计的渐近性质,对文献中的相应结果进行了推广,也是对经典Logit模型PGEE估计的渐近性质更深一步的研究.