【摘 要】
:
模型的变量选择是统计建模中很重要的问题之一,关于线性模型的变量选择研究,前人已经做了很多工作,尤其引人注目的是1996年Tibshirani提出的Lasso方法,它可以同时做到变量的
论文部分内容阅读
模型的变量选择是统计建模中很重要的问题之一,关于线性模型的变量选择研究,前人已经做了很多工作,尤其引人注目的是1996年Tibshirani提出的Lasso方法,它可以同时做到变量的选择和参数的估计。随着解决此类问题的有效算法LARS的提出,Lasso及其相关改进方法的研究已经成为了当今统计学界的热门问题。Elastic Net是Lasso的一种有效改进方法,它在处理微阵列数据方面要显著优于Lasso法,即当数据中的变量间存在组效应时,ElasticNet方法能够将群变量全部选出。本文将该方法应用于广义线性模型,分别在Logistic模型和Poisson模型中推广了Elastic Net估计的这一性质,证明了这两种模型在研究数据存在组效应情况下,Elastic Net方法同样可以将群变量全部选出。另外,本文还通过实际的和模拟的数据例子,分析验证了Elastic Net方法相比于Lasso方法和Ridge方法在模型变量选择方面的良好表现。本文第一章回顾了普通线性模型和广义线性模型在变量选择方面的研究进展,第二章介绍了广义线性模型和Elastic Net方法的一些相关预备知识,第三章和第四章则将Elastic Net分别应用于Logistic模型和Poisson模型,给出了两种模型下Elastic Net估计的定义,讨论了该估计的组效应性质,并通过数据例子进行了分析和验证,文章最后对全文进行了总结并提出了一些有待进一步研究的问题。
其他文献
基于有限元算法和Maxwell应力张量法,分析了紧聚焦高斯光束照明下金基底表面的金纳米球所受光力。利用无结构的平整金基底,被捕获的金纳米颗粒和金基底之间能够产生间隙表面
在中国现代文学史上,陈铨文学思想和戏剧创作多为学术界关注,尤其是多聚焦于他的“民族主义文学创作”所取得的成就。然而,就目前的研究状况而言,对陈铨的研究尽管已有近80年
党的十八大报告指出,反对腐败、建设廉洁政治,是党一贯坚持的鲜明政治立场,是人民关注的重大政治问题,这个问题解决不好,就会亡党亡国。近些年来,我们党加大反腐败力度,廉政建设取得
催乳素(PRL)是由脑垂体及某些垂体外组织器官如乳腺等分泌的一种单链多肽类激素。PRL在调节动物水和电解质平衡、发育和生长等多项生理活动中起着作用。催乳素受体(Prolactin
目的:多发性骨髓瘤(Multiple Myeloma,MM)是一种以浆细胞异常克隆为特征的B细胞肿瘤,其是第二大常见的血液系统恶性肿瘤。近年来,由于对MM生物学特征、细胞遗传学异常以及肿
鲁道夫·阿恩海姆的艺术表现论从视知觉动力出发,分析了艺术表现的原因和方法,对后世学者的艺术理论研究和艺术家创作都有着重要的指导意义。在油画的发展过程中,表现性
目的观察傅氏名方完带汤加针刺疗法治疗脾虚肝郁型带下病的临床疗效。方法将脾虚肝郁型带下病患者分成治疗组和对照组。对照组56例采用完带汤加减口服。治疗组56例采用完带汤
生物样品包括血浆、组织、尿液及细胞等,具有成分复杂、干扰物质多等特点,对生物样品前处理技术极大的影响了实验的灵敏度与准确性。文章主要对生物样品处理常用技术的特点、方
乙醇是代替石化燃料的可再生能源主流之一。文章主要对发展乙醇汽油燃料的优势及现状进行综合评述,并重点提出乙醇汽油对车辆性能造成的影响和解决办法,从而为我国推广使用车
目的观察妇科手术留置导尿预防尿路感染的护理效果。方法选取我院2013年4月~2015年4月收治的妇科留置导尿患者170例为研究对象,将其随机分为对照组与观察组,各85例,对照组患