线性模型中的参数估计及稳健变量选择方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lyaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
参数估计是建立线性模型最为关键的部分之一,其直接影响统计模型的正确性,因此很多研究者对如何提高参数估计的准确度做了大量研究工作。在数据正常情况下,目前已有很多切实可行的参数估计方法,而本文主要研究当数据中同时存在复共线性数据和异常值或数据来自于重尾分布时,如何进行参数估计。本文主要研究以下两种情况下线性模型中如何进行参数估计。  第一种情况,当所有解释变量都是重要变量,数据中同时存在复共线性和异常值时,本文结合前人提出的估计,提出了一种新的估计形式----带约束的双参数稳健岭估计(RTRME)。该新估计具有岭估计、双参数估计、稳健估计的优良性质,能同时克服数据中复共线性和异常值的影响。本文在均方误差矩阵准则下从理论上将新估计RTRME与RTRE和TRME做比较。数值模拟实验表明,不同的参数条件下,新估计RTRME几乎总是优于RTRE和TRME,随后给出的数据实例同样证明RTRME优于另两种估计,说明本文提出的新估计具有实际操作可行性。  第二种情况是,当解释变量中存在冗余变量,数据中存在复共线性和异常值时,我们采用稳健变量选择法进行参数估计。本文首先介绍了传统稳健变量选择法LAD-lasso和稳健估计PWLS,结合二者的优点,本文提出了新的稳健变量选择方法PWLS-LAD。本文介绍了该新方法的实现思想和算法,并讨论了如何进行截断参数的选取。本文通过数值模拟实验,在正常数据、包含异常值的数据、重尾分布数据三种情况下,将新方法PWLS-LAD与传统变量选择法LASSO、SCAD、LAD-lasso进行了比较。主要比较了各方法选择非0系数变量的准确率、模型预测误差、参数估计的MSE值。实验结果表明,在数据正常时,新方法与传统方法效果没有明显差距,当数据中存在异常值或数据服从重尾分布时,传统变量选择法不及稳健方法变现好,同时稳健方法中,新方法PWLS-LAD又优于一般LAD-lasso,说明本文提出的新方法PWLS-LAD具有广泛的适应性,并且具有良好的稳健性。
其他文献
失业保险制度是国家通过立法强制实施,由社会集中建立基金,对非因本人意愿中断就业而暂时失去生活来源的劳动者提供基本生活保障和就业援助的一项社会保险制度。自1986年建立实施以来,该项制度在保障失业人员的基本生活,促进再就业,健全劳动力服务市场体系,维护社会稳定等方面发挥了积极的作用。然而,近年来屡禁不止的失业保险欺诈行为正威胁着失业保险制度的有效运行。本文运用信息不对称理论对当前失业保险欺诈进行研究