惩罚COX模型和弹性网技术在高维数据生存分析中的应用

来源 :山西医科大学 | 被引量 : 24次 | 上传用户:alyue_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:利用DNA微阵列技术和蛋白质谱技术测出的基因或蛋白等高维生物数据对癌症病人进行生存预测已不能再利用传统Cox比例风险模型。本论文将探讨惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)用于高维数据生存分析的优劣,从而揭露死亡或其他结局发生的时间和生物数据之间的关系,为得到更精确的诊断及预后从而改进治疗提供合理的方法依据。方法:介绍惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)的基本原理。针对基因或蛋白生物信息数据的高维度、强相关、小样本的特点进行模拟研究,对Van’t Veer等学者乳腺癌研究数据集进行分析,考察这些模型的预测性能。采用R软件进行数据模拟及分析。结果:以R 2作为模型预测性能的评价标准,从模拟实验中我们得出各自变量相关程度一样时随着数据资料方差的增大,各种模型筛选出的自变量倾向于增多,模型评价指标结果R2也呈增大趋势,模型拟合也越好。且随着删失比例的增加,几种方法的预测效能都会降低,说明模型的预测能力会受到删失比例的影响。结论:L2-COX模型和L1-COX模型都是处理高维生存资料的方法,只是L2-COX模型没有降维作用,但是处理共线性的效能强。L1-COX模型主要用来对高维数据进行降维而处理共线性的功能稍弱。EN-COX模型同时汲取了L1和L2两种模型的优点,既能有效处理共线性又可以降维还同时改进了L1,是分析处理高维小样本生存资料的理想模型。
其他文献
目的探讨在以NG108-15细胞作为神经元代表、Aβ25-35(β-amyloid protein25-35)诱导凋亡的AD(Alzheimet’s Disease)细胞模型中,人参皂苷Rg1保护神经元的作用与NF-κB(Nuclea
《任勇与数学学习指导》是北京师范大学出版社出版的“教育家成长丛书”中的一本。初识任勇,是22年前的事。那时我们在黄山开完全国第二届数学教学研究会后,一同乘到上海的汽
通过对电子档案与纸质档案在载体形式、内容属性、保护特点等几方面差异的比较,揭示了电子档案和纸质档案所各自存在的特性及其先进性,明确了档案信息管理需要注意的一些主要问
与许多中国现代作家不同,林语堂与外国文化有着天然的、经验的和稳定的联系,这就决定了探讨林语堂与外国文化关系的重大价值和意义。林语堂对古希腊、印度、日本、美国和英国
目的观察综合康复治疗锁骨骨折手术后肩关节功能障碍患者的疗效。方法选择锁骨骨折手术后肩关节功能障碍患者21例,进行系统的综合康复治疗,并于治疗前及治疗2个月后对患者肩
知识以及附着于其上的知识产权尤其是专利权,应成为企业技术发展关注的重点。面对现今汽车产业自主研发急剧膨胀的现状,应当从专利战略分析入手,对自主研发加以规划,并提倡从专利
放射治疗作为肿瘤治疗常用手段之一,在治疗过程中占有重要地位,约70%的肿瘤病人需要进行放射治疗。剂量计算的精确性是放射治疗疗效的基础,剂量计算精度必须控制在±5%以内。
关于曹丕的&#39;文气&#39;,研究者是见仁见智,本文则试图对&#39;文气&#39;作出系统的考察.本文的基本看法是:如果说,<典论@论文>讨论了作家论、创作论、批评方法和文学价值论
目的以叶酸受体、AFP蛋白作为肿瘤细胞的生物靶点,将纳米金(Au NPs)表面修饰上叶酸(folic acid,FA)或抗AFP单克隆抗体(Anti-AFP mAb),分别制备得到Au NP-FA和Au NP-anti-AFP mAb两种靶