论文部分内容阅读
高维数据在许多领域正受到越来越广泛的关注,是目前统计学领域和应用研究中面临困难最多、挑战最严峻,同时也是最有可能取得突破的研究领域之一.在对高维数据进行分析时,运用传统的多元统计分析方法处理实际数据时通常会碰到数据不符合正态分布或数据本身没有多少先验信息的情况.所以,处理时通常考虑非参数的方法.而基于传统的经验似然所形成的方法现已被证明有一定效果.这是因为经验似然既拥有参数方法的有效性又具有非参数方法的稳定性.它在很多情形下比正态逼近方法精确,特别是当数据来自非正态总体或方差估计不稳定时.此外,它有类似于bootstrap的抽样特性,且相比之下更有其自身的优越性,如域保持性、变换不变性以及Bartlett纠偏性.跟bootstrap日比,它的另一个好处是计算量小,并且在一些给定的正则条件下,Wilks定理成立.在这篇论文里,我们的主要目的是检验一个可能的高维线性回归模型的系数是否等于一个给定值.通过把传统经验似然方法里面的高维约束条件巧妙地变换成与维数无关的低维情形,我们首先提出了一个新奇且简单的经验似然检验方法.这个方法保留了传统经验似然方法里的最优性准则并且拥有其他好的特性.在计算偏经验似然函数的时候,涉及到在约束条件下求极大值,这也正是运用经验似然方法的一个关键步骤.为了确保犯第一类错误的概率更加接近于给定显著性水平,我们进一步在先前提出的方法里加入了伪观测值,从而得到更优的检验统计量.随后,我们在几个不同的例子里做了相关模拟以评估我们所提出的方法的检验效果.模拟结果显示我们所提出的检验方法都要优于前人所提出的方法.而由于例子中回归系数取值的特殊性,我们之后又提出了另一种可以用于检验更一般的系数的方法并给出相关定理及模拟结果.本文的主要创新点在于:(1)我们尝试着把传统的经验似然方法里与p有关的高维约束条件巧妙地变换成低维情形,以此构造出新的约束条件,再利用经验似然的方法解决相关假设检验问题.(2)我们在前人的方法及我们所提出的简单经验似然方法里加入了伪观测值,从而作出了一个新奇的调整.调整后的经验似然方法保留了之前方法的所有最优性准则.不仅如此,该方法下的区间覆盖率更接近于置信水平,而且还不需要Bartlett校正和bootstrap方法里那么复杂的程序.(3)对于更一般地回归系数,我们考虑了将原限制条件中的分量加权相加,并且这个加权也是随机的,从而解决了线性模型中回归系数更为一般情况下的假设检验问题.(4)我们针对不同的维数,有区别地加入了约束条件的个数,一方面使得犯两类错误的概率令人满意,另一方面也大大地节省了计算成本.