论文部分内容阅读
建模技术已经广泛应用于分析化学等各个学科中。模型的评价尤为重要,因为它既可指导学习方法或选择模型,又可为我们提供最终选定模型的质的度量。而在近红外光谱定量校正模型中,波长选取方法是基础。光谱波长的选取方法,对建立预测能力强、稳健性好的分析模型至关重要。
本论文主要的研究工作包括两个部分:1.蒙特卡罗交叉效验模型评价方法及其在QSAR/QSPR研究中的应用;2.近红外光谱波长的选择及其校正模型的建立。具体内容如下:
第二章介绍了在研究过程中牵涉到的相关理论背景及其常用方法。首先给出了线性模型的数学上的说明和建立方法。然后介绍了各种常用的模型评价的原理及其方法。最后对近红外光谱中常用的波长选择及其定量模型的建立方法及原理进行了介绍。
第三章的主要内容是模型评价方法的研究。特定方法所得模型的性能,特别是预测能力,是最受大家关注的。本文将蒙特卡罗交叉效验法用于对QSAR/QSPR模型的预测能力的评价。蒙特卡罗交叉效验法的主要思路是利用蒙特卡罗随机方法把样本随机的分成训练集和预测集,训练集用来训练模型,预测集用来计算模型的预测误差。重复N次后,取N次预测误差的均值作为最终的模型预测误差,同时计算N次的预测误差的方差可以用来考察模型的稳定性。与最为常用的K一折交叉效验相比,本方法可以提供有关模型的更多信息,为我们选择合适的模型提供帮助。
第四章对近红外光谱定量模型建立过程中的波长选择进行了研究。文中提出了改进移动窗口偏最小二乘回归法。该方法在移动窗口偏最小二乘回归法的基础上,通过引入信息重叠度的概念,借助正交投影技术,使得选择出的波长区包含更多的有用信息,继而建立一个更精确的校正模型。与移动窗口偏最小二乘回归法及全谱偏最小二乘法比较,所得模型有更高的精度。