论文部分内容阅读
近红外光谱作为一种快速无损检测技术在农产品品质分析领域发挥着越来越重要的作用。然而近红外光谱中往往存在着大量无信息波长甚至是噪声波长,因此波长选择已经成为近红外光谱分析中一个关键的环节,目前已有多达几十种波长选择算法。本文系统分析和研究了现有波长选择算法原理的差异,并将近红外光谱分析中常用波长选择算法大体上划分为基于偏最小二乘模型参数、智能优化算法、连续投影策略、模型集群分析策略和波长区间选择等五类。为了解决现有方法存在的可靠性和稳定性问题,本文在近红外光谱谱学特点的基础上,分别借鉴模型集成、模型集群分析和串联等三种新思路开展了以下几项研究,并采用玉米、土壤、药片等三种代表性样品体系进行了算法验证。(1)首次采用移动窗口平滑集成策略(MWWS)对竞争性自适应加权采样算法(CARS)进行了改造,得到了一种名为MWWS-ECARS的新型波长选择算法。实验结果表明,MWS-ECARS算法通过移动窗口对CARS算法重复运行后各波长的累积被选频率进行平滑处理,不仅克服了 CARS算法选择波长的不稳定性,而且还可以通过调节移动窗口宽度和阈值的大小对最终选中波长区间的宽度进行优化。(2)在模型集群分析(MPA)的框架下提出了一种新型波长区间组合优化算法(ICO)。ICO算法首先采用软收缩的方式对波长区间组合进行优化,然后采用局部搜索的方式对最终入选区间的宽度进行自动优化。实验结果表明ICO算法不仅具有软收缩的特点,还具有收敛速度更快,参数设置较少等优点;ICO算法中采用波长区间替换波长点作为优化对象,既可以较好地降低软收缩策略在寻优过程中的计算负担,又可以降低优化算法出现过拟合的风险;其中采用的WBS方法被证明比WBMS方法更适合用于在模型集群分析框架下开发新型波长选择算法,因为其可以通过在MPA的随机采样环节引入更合适水平的随机因素来克服WBMS方法存在的缺陷。(3)基于算法串联的思路采用连续投影算法(SPA)对MWWS-ECARS和ICO算法选中的波长进行简化,结果表明SPA算法可以在保证所建模型的预测能力不出现显著下降的同时,进一步简化上述两种算法选中的波长点,但是样品体系越复杂,简化的力度就越小。(4)通过实验考察了不同预处理方法对ICO算法选择波长分布和建模效果的影响情况。结果表明,不同光谱预处理方法对于ICO算法选择波长的分布情况和建模效果均有着较强的影响。