论文部分内容阅读
对于线性回归模型的参数估计问题,由于最小二乘估计所具有的许多优良性质,使它一直是最具影响力、应用最广泛的参数估计方法,处于回归参数估计的核心地位。但是随着电子计算机的飞速发展,线性回归模型被应用于更多的领域,用之解决的问题越来越复杂,涉及到的变量也越来越多。这就不可避免的会出现选择的变量多余、赘余、漏选、少选的情况,从而使选择的变量或随机干扰项出现序列相关性、异方差性、多重共线性等问题。当这些问题存在的时候,如果仍然使用最小二乘估计进行参数估计的话,就会使估计的参数值不稳定、经济意义不明确,有时甚至会出现严重的原则性错误。因此,统计学家们就针对这些问题,或是提出改进最小二乘方法,或是创造新的参数估计方法。这就促进了有偏估计的产生。本论文是针对回归自变量之间存在的多重共线性问题,综合前人提出的岭估计(或广义岭估计)和Stein压缩估计,获得了一种新的有偏估计方法——综合c-K岭估计。我们不仅给出该估计方法的定义,还证明了该估计具有的一些基本性质(如线性性、有偏性、压缩性等)和优良性质(相对于最小二乘估计和岭估计的优良性、可容许性等)。最后,我们给出了综合c-K岭估计的参数c和K的两种选取方法,一种是用典则形式下回归系数的无偏估计和随机误差的方差的无偏估计来计算出参数c和K;另一种是通过迭代方法计算得出回归系数的迭代解,并说明了该迭代解是不依赖于岭参数c和K的。在本论文的最后,我们利用新给出的综合c-K岭估计方法,研究了山东省城镇居民的消费水平问题。根据理论知识和以往经验,选取了7个与城镇居民消费水平有关的指标,并从山东省统计局网站获取了1984年—2012年间的相关统计数据。在对这些数据进行了简单的处理以后,建立了线性回归模型,并分别用最小二乘估计、岭估计和综合c-K岭估计进行了参数估计,得到相应的经验回归模型。最后通过对得出的3种不同的估计进行比较,验证综合c-K岭估计的优良性。