论文部分内容阅读
众所周知,在考察随机响应变量Y与解释变量X间关系时,经常使用正态线性回归模型:Y=X β+ε, ε~N2n(0, σ),此时要求Y满足所谓Gauss-Markov条件:Y~N2n(Xβ, σ)。容易理解,并非所有随机响应变量都能符合这一要求。在无法满足Gauss-Markov条件时,可通过引入参数λ将Y变换为Y (λ),以使Y (λ)来自正态线性回归模型:Y (λ)=X β+ε, ε~N2n(0,σ)。在所有可能的变换中,Box-Cox变换[1]是提出得较早且研究得最为成熟的,产生了丰富的文献。然而,稍加分析,就可发现Box-Cox变换存在着截断问题,这一问题的存在一方面造成无法模拟模型,另一方面使得认为经Box-Cox变换所得Y (λ)来自正态线性回归模型是不恰当的。为了克服Box-Cox变换的截断问题,Yang[2]引入了双幂变换。双幂变换克服了Box-Cox变换的截断问题,且具有与Box-Cox变换相类似的性质,在经济持续时间和医疗/工程事件时间的建模与分析上非常有用。本文主要目的是研究双幂变换下正态线性回归模型中参数的统计推断问题,包括两方面的工作:一是讨论变换参数λ的极大似然估计λ ML的存在唯一性和精确分布,并对极大似然估计与最小二乘估计这两种估计的拟合效果进行比较研究;二是构造变换参数λ的置信域并据之考虑假设检验问题。结果表明了,在双幂变换下,正态线性回归模型中变换参数的极大似然估计存在且唯一;变换参数的极大似然估计λ ML的分布不仅依赖于其本身,而且与回归系数及方差密切相关;变换参数λ的极大似然估计λ ML满足概率P (λ ML=0)是严格大于0的,即表示λM L是一奇异随机变量,不具有密度函数;通过比较分析,当模型中变换参数或方差取较大真实值的情况下,极大似然估计方法下数据拟合效果要优于最小二乘估计(在均方误差意义下),并随着样本容量n的增加,两种估计效果无显著差异;依据置信域构造的检验的功效函数显示它与正态线性回归模型中的方差密切相关,具体表现为:方差取值越小,功效函数越能达到较高水平,但与此同时,在不同变换参数λ取值下,功效函数也越不稳定。