论文部分内容阅读
拉曼光谱和近红外光谱是最常用的光谱快速检测技术,是食品检测的一种有效技术手段。拉曼光谱是物质的指纹光谱,对物质定性分析过程简单且识别率高,模型传递效果好;但拉曼光谱的强度非常弱,信噪比不高,定量分析的准确性和稳定性都不够好。近红外光谱属于吸收光谱,强度大,光谱一致性好,采用化学计量学建模以后,定量检测效果好,但模型传递效果不理想;此外,它是形貌光谱,缺乏指纹谱线,定性(物质判别)比较困难。本文探索一种多光谱数据融合的算法,核心思路是将近红外光谱融合到的拉曼光谱中建立拉曼-近红外混合模型,以期用近红外光谱的信息提高拉曼光谱物质定量分析的准确度,用拉曼光谱的指纹特征提高模型传递能力。
本文首先针对便携式光谱检测设备的信号特征,研究了光谱数据预处理的自动算法,包括:光谱去尖峰算法、光谱去噪算法、光谱去基线算法以及光谱归一化算法;本文还将研究的自动算法编写了C代码,并将这些算法成功移植到了便携式拉曼光谱仪上。
本文对比研究了机器学习和神经网络等两大类方法,决策树、支持向量机、BP神经网络和LSTM神经网络等四种光谱分析算法;在光谱模型建立过程中,尽可能保留所有光谱信息,将全光谱用于模型训练;工作分为定性分析、定量分析和模型传递等三个主要部分,结果如下:
(1)定性分析:本文采用决策树、支持向量机和LSTM神经网络建立了被测物拉曼光谱的二分类和多分类模型,并用这些模型对单一的被测物进行定性分析;其中①决策树算法的二分类正确率为98.93%,多分类的正确率为63.28%;②支持向量机算法二分类正确率为100%,多分类正确率91.40%;③深度学习LSTM网络算法的四分类定性分析准确率达到100%。
(2)定量分析:①用决策树算法建立了葡萄糖近红外光谱定量分析模型,校正集的R2=0.9960,RMSE=0.0166,MRE=0.0099;②用支持向量机算法分别建立了近红外光谱、拉曼光谱以及拉曼-近红外融合光谱的定量分析模型,其中近红外光谱校正集的R2=0.9935,RMSE=0.0224,MRE=0.0488;拉曼光谱校正集的R2=0.9246,RMSE=0.0570,MER=0.0797;拉曼-近红外融合光谱模型的R2=0.9975,RMSE=0.0141,MRE=0.0292。③用BP神经网络建立了近红外定量模型,校正集的R2=0.9962,RMSE=0.0215,MRE=0.0439。④用LSTM神经网络建立了近红外光谱、拉曼光谱以及拉曼-近红外融合光谱的定量分析模型,其中拉曼光谱的定量分析模型校正集的R2=0.9590,RMSE=0.0058,MRE=0.1505;近红外光谱定量分析模型校正集R2=0.9883,RMSE=0.0298,MRE=0.0586;拉曼-近红外融合光谱的定量分析模型校正集的R2=0.9886,RMSE=0.0243,MRE=0.0385。
(3)模型传递:①用深度学习LSTM神经网络算法建立的四分类定性分析模型在同类型仪器的台间传递的准确率达到100%。②用支持向量机算法分别建立了近红外光谱、拉曼-近红外融合光谱的定量分析模型,并用四台仪器开展了模型传递实验;其中近红外光谱模型在四台仪器上传递的结果R2分别为0.7951、0.8664、0.8782和0.8819,拉曼-近红外模型在四台仪器上传递的结果R2分别为0.9365、0.9411、0.9303和0.9224。③深度学习LSTM神经网络算法分别建立了近红外光谱、拉曼-近红外融合光谱的定量分析模型,并用四台仪器开展了模型传递实验;其中近红外光谱模型在四台仪器上传递的结果R2分别为0.7768、0.7996、0.8027和0.7914,拉曼-近红外模型在四台仪器上传递的结果R2分别为0.5548、0.8444、0.9539和0.9353。
本文首先针对便携式光谱检测设备的信号特征,研究了光谱数据预处理的自动算法,包括:光谱去尖峰算法、光谱去噪算法、光谱去基线算法以及光谱归一化算法;本文还将研究的自动算法编写了C代码,并将这些算法成功移植到了便携式拉曼光谱仪上。
本文对比研究了机器学习和神经网络等两大类方法,决策树、支持向量机、BP神经网络和LSTM神经网络等四种光谱分析算法;在光谱模型建立过程中,尽可能保留所有光谱信息,将全光谱用于模型训练;工作分为定性分析、定量分析和模型传递等三个主要部分,结果如下:
(1)定性分析:本文采用决策树、支持向量机和LSTM神经网络建立了被测物拉曼光谱的二分类和多分类模型,并用这些模型对单一的被测物进行定性分析;其中①决策树算法的二分类正确率为98.93%,多分类的正确率为63.28%;②支持向量机算法二分类正确率为100%,多分类正确率91.40%;③深度学习LSTM网络算法的四分类定性分析准确率达到100%。
(2)定量分析:①用决策树算法建立了葡萄糖近红外光谱定量分析模型,校正集的R2=0.9960,RMSE=0.0166,MRE=0.0099;②用支持向量机算法分别建立了近红外光谱、拉曼光谱以及拉曼-近红外融合光谱的定量分析模型,其中近红外光谱校正集的R2=0.9935,RMSE=0.0224,MRE=0.0488;拉曼光谱校正集的R2=0.9246,RMSE=0.0570,MER=0.0797;拉曼-近红外融合光谱模型的R2=0.9975,RMSE=0.0141,MRE=0.0292。③用BP神经网络建立了近红外定量模型,校正集的R2=0.9962,RMSE=0.0215,MRE=0.0439。④用LSTM神经网络建立了近红外光谱、拉曼光谱以及拉曼-近红外融合光谱的定量分析模型,其中拉曼光谱的定量分析模型校正集的R2=0.9590,RMSE=0.0058,MRE=0.1505;近红外光谱定量分析模型校正集R2=0.9883,RMSE=0.0298,MRE=0.0586;拉曼-近红外融合光谱的定量分析模型校正集的R2=0.9886,RMSE=0.0243,MRE=0.0385。
(3)模型传递:①用深度学习LSTM神经网络算法建立的四分类定性分析模型在同类型仪器的台间传递的准确率达到100%。②用支持向量机算法分别建立了近红外光谱、拉曼-近红外融合光谱的定量分析模型,并用四台仪器开展了模型传递实验;其中近红外光谱模型在四台仪器上传递的结果R2分别为0.7951、0.8664、0.8782和0.8819,拉曼-近红外模型在四台仪器上传递的结果R2分别为0.9365、0.9411、0.9303和0.9224。③深度学习LSTM神经网络算法分别建立了近红外光谱、拉曼-近红外融合光谱的定量分析模型,并用四台仪器开展了模型传递实验;其中近红外光谱模型在四台仪器上传递的结果R2分别为0.7768、0.7996、0.8027和0.7914,拉曼-近红外模型在四台仪器上传递的结果R2分别为0.5548、0.8444、0.9539和0.9353。