论文部分内容阅读
近红外(NIR)光谱是一种快速分析技术,利用数学和统计计量方法建立定标模型来实现对未知样本的定性或定量分析。然而,由于NIR光谱信号重叠严重,没有明显的波峰能反应单一待测成分信息,利用常规的线性分析方法定量预测样本的含量,定标预测模型有可能被理想化,不利于在线检测的实际应用。本文利用统计学与多模型集成建模等方法,给定量分析模型添加容错机制,将傅里叶变换近红外(FT-NIR)定量分析转化为半定性判别分析。提出区间间隔搜索主成分分析逻辑回归(iPCA-LR)以及区间间隔搜索主成分分析支持向量机(iPCA-SVM)方法,结合先验定量预测值,通过设定不同的容错阈值范围,给样本赋予先验判别标记,将定量分析模式转换为半定性判别模式,建立FT-NIR半定性判别模型,对比讨论不同子波段数量的区间划分数据的潜变量转换模式,优选FT-NIR光谱特征子波段,并对每一个固定的阈值范围取值,选择最优准确率的子波段建立i PCA-LR模型和iPCA-SVM模型。建立土壤总氮和有机质的FT-NIR光谱半定性分析模型。土壤总氮的最优偏最小二乘i PCA-LR模型(PLS-iPCA-LR):不同阈值范围最优模型的预测准确率均达到了75%以上,针对连续两个波段的情况进行波段合并,重新建模确定判别准确率,各个区间划分的优选子波段或合并子波段的准确率均在90%以上;最优偏最小二乘iPCA-SVM模型(PLS-iPCA-SVM):不同阈值范围最优模型的预测准确率均在68%以上,各个区间划分的优选子波段判别准确率均达到86%以上;最优人工神经网络iPCA-LR模型(ANN-iPCA-LR):不同阈值范围最优模型的预测准确率均在80%以上,各个区间划分的优选子波段判别准确率均达到了90%以上;最优人工神经网络iPCA-SVM模型(ANN-iPCA-SVM):不同阈值范围最优模型的预测准确率均在70%以上,各个区间划分的优选子波段判别准确率均达到了1。土壤有机质的最优PLS-iPCA-LR模型:不同阈值范围最优模型的预测准确率均在74%以上,各个区间划分的优选子波段判别准确率均达到了88%以上;最优PLS-iPCA-SVM模型:不同阈值范围最优模型的预测准确率均在70%以上,各个区间划分的优选子波段判别准确率均达到了75%以上;最优ANN-iPCA-LR模型:不同阈值范围最优模型的预测准确率均在80%以上,各个区间划分的优选子波段判别准确率均在95%以上;最优ANN-iPCA-SVM模型:不同阈值范围最优模型的预测准确率均在73%以上,各个区间划分的优选子波段判别准确率均达到1。结果表明,将定量预测问题转换为半定性判别问题的计量学方法能够解决常规定量分析容易过拟合和过于理想化的问题,有利于提高统计模型的预测效果,半定性判别结果更符合实际。NIR光谱分析的半定性计量方法有望为实现农业物质成分的快速高精度鉴别提供技术参考。