化学建模中的蒙特卡罗交叉效验及改进移动窗口偏最小二乘回归

来源 :中南大学 | 被引量 : 0次 | 上传用户:qh12121312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建模技术已经广泛应用于分析化学等各个学科中。模型的评价尤为重要,因为它既可指导学习方法或选择模型,又可为我们提供最终选定模型的质的度量。而在近红外光谱定量校正模型中,波长选取方法是基础。光谱波长的选取方法,对建立预测能力强、稳健性好的分析模型至关重要。 本论文主要的研究工作包括两个部分:1.蒙特卡罗交叉效验模型评价方法及其在QSAR/QSPR研究中的应用;2.近红外光谱波长的选择及其校正模型的建立。具体内容如下: 第二章介绍了在研究过程中牵涉到的相关理论背景及其常用方法。首先给出了线性模型的数学上的说明和建立方法。然后介绍了各种常用的模型评价的原理及其方法。最后对近红外光谱中常用的波长选择及其定量模型的建立方法及原理进行了介绍。 第三章的主要内容是模型评价方法的研究。特定方法所得模型的性能,特别是预测能力,是最受大家关注的。本文将蒙特卡罗交叉效验法用于对QSAR/QSPR模型的预测能力的评价。蒙特卡罗交叉效验法的主要思路是利用蒙特卡罗随机方法把样本随机的分成训练集和预测集,训练集用来训练模型,预测集用来计算模型的预测误差。重复N次后,取N次预测误差的均值作为最终的模型预测误差,同时计算N次的预测误差的方差可以用来考察模型的稳定性。与最为常用的K一折交叉效验相比,本方法可以提供有关模型的更多信息,为我们选择合适的模型提供帮助。 第四章对近红外光谱定量模型建立过程中的波长选择进行了研究。文中提出了改进移动窗口偏最小二乘回归法。该方法在移动窗口偏最小二乘回归法的基础上,通过引入信息重叠度的概念,借助正交投影技术,使得选择出的波长区包含更多的有用信息,继而建立一个更精确的校正模型。与移动窗口偏最小二乘回归法及全谱偏最小二乘法比较,所得模型有更高的精度。
其他文献
分子筛的氮化是近年来新兴的一种合成碱性分子筛的方法,由于氮化过程中电负性低的氮原子部分取代了分子筛骨架中电负性高的氧原子,而使分子筛具有一定的碱性。介孔分子筛由于比
瑞戈菲尼,一种新型多激酶抑制剂,可以抑制肿瘤细胞的增殖和肿瘤血管的生成,对于转移性结直肠癌,胃肠道间质瘤的临床治疗等表现出很好的疗效。因此,开展瑞戈菲尼的合成方法研究具有
三氮烯类化合物被广泛应用于金属离子检测的显色剂,有机合成的保护基,杂环化合物合成的关键中间体。随着研究的深入,人们发现三氮烯类化合物还具有抗肿瘤活性,并因此开发出了
锦纶66是在汽车轮胎帘线中应用最为广泛的高分子材料之一,具有高强度、与橡胶之间粘接力良好等优点,但随着汽车工业对轮胎性能的要求逐渐变高,其较低的模量和热尺寸稳定性成
大规模的家禽养殖产生了大量废物,其中羽毛产量位居榜首,由于其难以被降解,而造成了很大的环境污染;羽毛主要由角蛋白构成,占到90﹪以上。角蛋白,胶原蛋白和丝蛋白都是纤维状蛋白质的