改进的高维非线性PLS回归方法及应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:GU988968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
偏最小二乘(PLS)回归是一种基于高维投影思想的新的非参数回归方法,可有效地将多元回归、主成分分析以及典型相关分析等功能有机地结合起来,因此,它已被誉为第二代多元统计分析方法。识别特异点和对变量集实施降维是回归建模前的两个重要的数据分析预处理过程。本文基于PLS回归模型,结合非线性核主成分分析、二叉树等多种方法,提出了改进的非线性偏最小二乘回归模型、二叉树降维方法和降维二叉树评价方法,并扩展了特异点识别方法。主要研究内容如下:提出了一种改进的非线性偏最小二乘回归模型。传统的线性及非线性PLS回归模型计算因变量集与提取的主成分之间的线性回归,而没有考虑因变量集和主成分之间可能是非线性关系。本文把因变量集对各个主成分的线性回归改进为可根据具体情况选择线性回归或非线性回归,每个主成分依旧表示成原始自变量集的线性回归方程。本文还具体分析并建立了汽车油耗及其他十个设计及性能方面的指标之间的非线性回归模型。提出了高维空间的二叉树降维方法及降维二叉树评价方法。本文提出了将传统的整体降维,改进为从局部降维再延伸到全局降维的一种逐步降维的新方法。如果样本变量数n过大,可对相关性最强的两个变量实施主成分分析或核主成分分析:提取第一个成分变量代替原来的两个变量,样本变量数则降维为n ?1,循环执行此降维过程,直到满足精度为止。整个降维过程表现为一棵二叉树或残缺二叉树。根据降维二叉树评价方法,采用天津市2008年各区县经济发展指标,具体对天津市18个区县的经济发展水平进行了科学的评价。分析并扩展了高维空间的特异点识别方法。在基于PLS回归识别特异点的分析技术基础上,将识别特异点的二维平面T 2椭圆图方法扩展到三维空间T 2椭球和高维空间T 2超椭球,同时基于谱系聚类法,提出了基于高维空间主成分谱系图的特异点识别方法,并对我国主要省份、城市的汽柴油价格进行了分析。
其他文献
ADP核糖基化因子(ADPribosylationfactor,ARF)家族作为霍乱毒素催化GS蛋白ADP核糖基化反应的辅助因子,目前其病理生理作用仅对从功能角度定义的这一蛋白家族有价值,而进一步
以丙烯酸(AA)、聚乙烯醇(PVA)、对苯乙烯磺酸钠(SSS)为原料,过硫酸钾为引发剂,N,N-亚甲基双丙烯酰胺为交联剂,采用溶液聚合法制备了P(AA-SSS)/PVA高吸水树脂。研究了引发剂用
目前,我国博物馆已成为青少年教育的重要场所,发挥着越来越多的教育作用。新时期,博物馆如何进一步丰富教育内容,创新教育手段,健全完善博物馆青少年教育功能,更好地发挥教育作用,是
介绍了公共路灯远程监控系统的结构原理、工作过程、硬件组成和软件设计,增加的措施提高了系统的可靠性。根据系统可实时掌握路灯的电压高低、电流大小、是否工作、警告等状
水利工程档案产生于整个水利基本建设全过程,是水利工程建设全过程的真实反映和记录,是工程验收、结算、运行、管理、维护、改造、扩建的依据。管理并利用好水利工程档案,使其在
高等植物中,单半乳糖甘油二酯(MGDG)和双半乳糖甘油二酯(DGDG)是组成叶绿体中光合膜的主要膜脂类型,其中MGDG是DGDG合成的前体,因而MGDG的合成在植物的正常生长发育中发挥着
背景与目的角膜新生血管(corneal neovascularization, CNV)是角膜外伤、感染后最常见的并发症,不但严重影响视力,也是角膜移植术后发生排斥反应的高危因素。血管内皮细胞的
自媒体的快速发展,为社会主义核心价值观教育带来挑战的同时,也赋予其传播的机遇。作为思想政治教育工作者,我们应顺应环境变化,创新大学生社会主义核心价值观教育途径。