论文部分内容阅读
由于在回归估计当中,经典的最小二乘估计仅仅关注了相应变量中心部分的变化趋势,存在一定的局限性,为了克服这种局限,更全面的了解数据,1978年,Koenker提出了分位数回归的方法。与常见的均值回归相比较而言,分位数回归是一种通过最小化加权残差绝对值和来建立模型的方法,这种方法能够通过设定不同的分位值点,来更全面的刻画数据整体的分布特征,尤其在针对模型存在误差项异方差、或数据包含有异常值时的情形下具有更好的表现。因此分位数回归方法受到了广泛的关注以及更为深入的实践应用。但分位数回归的估计效率会受到分位点取值的影响,因此衍生出了复合分位数回归方法,在分位数回归的基础上,强制不同分位点上的回归系数保持一致,从而进一步提高估计的效率。模型平均化是将来自不同模型的估计结果或预测结果,通过一定的权重进行平均化的方法,也称为模型组合。与模型选择相比,模型平均化方法能够避免遗失数据信息及由于选择错误模型而造成偏差的风险,相对于模型选择方法更加稳健,是解决模型选择不确定性并减低误差的有效方法。本论文中,介绍了复合分位数回归及模型平均化的理论基础和优良性质,并在局部偏差框架下,将这两方法相结合,用于参数估计和相关变量预测。基于复合分位数回归的平均模型能够在随机误差项方差非有限的情况下,依旧保证模型的有效性和稳健性。同时,论文证明了其候选子模型的参数估计结果具有渐近性质,从而进一步证明平均化后估计结果的有效性。最后对比了各类数据在最小二乘法、中位数回归法、复合分位数模型和基于不同权重选择的复合分位数平均方法下,模型的预测结果,结果显示基于复合分位数回归的平均估计结果具有较小的均方误差,尤其在误差项不具有有限方差或数据存在离群点时表现良好。