基于稳健估计方法的复共线性模型及变量选择研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zzmaazhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性模型在现代统计方法中起着核心作用,这些模型能够在整个定义范围内或至少分段地近似度量数据结构。在假设总体分布形式已知的情况下,通过样本来进行总体分布的参数估计是建立线性模型最为关键的部分之一,其直接影响统计模型的正确性。为了提高参数估计的准确度,学者们做了许多研究,目前已有很多切实可行的参数估计方法被采用。本文中提出了两种新的稳健参数估计方法,能解决数据中同时存在复共线性与异常值的问题,还提出了一种新的稳健变量选择方法,能在各种未知的数据分布类型下进行变量选择。首先考虑当所有解释变量都是重要变量的情况。我们结合前人的估计,提出了两种新的估计形式:1、稳健的双参数估计(Robust Two Parameters estimator,RTPE);2、稳健的约束Liu估计(Robust Restrict Liu estimator,RRLE)。相较于单纯的M稳健估计方法和单纯的Liu估计,岭估计,约束Liu估计,双参数估计以及带约束的Liu估计等,这两种估计形式对于数据中同时存在复共线性和异常值的情况均具有很好的估计效果,同时也优于过去提出的稳健Liu估计,稳健双参数估计等。本文分别在均方误差以及均方误差矩阵准则下比较了新的估计形式与非稳健形式,稳健Liu估计,稳健岭估计以及与约束Liu估计之间的优越性。数值模拟实验表明,在不同的参数条件下,新估计优于与之相比较的其他估计,并且在之后的数据实例中同样证明了新估计的优越性。说明本文提出的新估计具有实际应用的可行性。另外,当解释变量中存在冗余变量,同时解释变量中存在异常值或者误差是重尾分布时,我们用采用稳健变量选择法进行参数估计。在传统变量选择的基础上,首先介绍加权的LAD-Lasso方法和稳健自适应性Lasso方法这两种稳健变量选择方法的思想以及参数选取方式,接着在其基础上提出一种新的稳健变量选择方法MIXW-R,并介绍了参数的选取与算法的实现,最后分别在误差项为正常数据,厚尾分布以及变量存在异常值的线性模型下,比较了新的稳健变量选择方法与前文提到的稳健或非稳健变量选择方法。最后通过数值模拟,验证了在不同的数据状态下,新估计方法具有更优的性能。
其他文献
<正>中亚紫菀木(Asterothamnus centrali-asiaticus)为半灌木超旱生植物,为亚洲中部特有种,广泛分布于亚洲中部荒漠区,但形成群落的较少。在我国主要分布于新疆、甘肃、宁夏
以大鼠力竭运动为模型,研究了支链氨基酸(BCAA)对血清和心肌中乳酸脱氢酶(LDH),谷草转氨酶(GOT),肌酸激酶(CK),α-羟丁酸脱氢酶(α-HBDH)等酶的活性以及心肌中Ca2+ ,Mg2+ 含
板坯低温加热Hi-B钢生产技术为当前生产取向硅钢高端产品的一种先进技术,板坯成分Als含量和常化温度的精准控制是获得高质量成品非常重要的工艺控制。本文主要针对大生产的不
[目的]基于生物信息学分析卵巢癌中的长链非编码RNAs(long noncoding RNAs,lncRNAs),筛选关键 lncRNAs 和差异表达基因(differentially expressed genes,DEGs),探讨差异表达l
“世界若有十分美,九分在耶路撒冷,一分在世界其他地方”~1。耶路撒冷是一座历史悠久的古城,是犹太教、基督教、伊斯兰教三大天启宗教的圣地,是超过世界一半人口的精神家园,
通络类中药的主要效果为活络、通络或通经络等功效,本次研究筛选了能够应用于治疗高血压的通络类中药进行研究,对于它们用于高血压患者的靶器官保护、症状改善、血压控制等方
前不久,新华社授权发布十三届全国人大常委会立法规划共116件。其中《长江保护法》被列入第一类项目。$$笔者认为,长江生态环境问题突出,除了执法不严,更深层原因在于:一是改革开
报纸
自2014年6月中国大运河成功列入《世界遗产名录》后,关于运河学的研究掀起了新的高潮,无论是运河河道管理、运河生态环境、运河遗产保护与开发,还是漕运制度、运河城镇与经济
为了解宁夏银北灌区暗管排水改善土壤水盐性状的具体效果,在平罗县五堆子暗管排水工程单元区布置监测试验网,通过监测地下水位埋深、土壤全盐量以及室内检测分析地下水样的矿
<正>2016年10月15日,"二十一世纪人类学讲坛(第三届)微信民族志、自媒体时代的知识生产与文化实践"学术研讨会在北京香山首农会议中心举行。会议由中国人民大学人类学研究所