论文部分内容阅读
随着我国工业规模的快速扩大,由工业生产、运输等环节带来的危害气体泄露事故越来越频繁发生,给人民群众的生命财产安全造成巨大的损失。利用红外光谱分析技术对泄漏的危害气体成分进行分析可为事故现场消防洗消工作提供决策依据,降低事故带来的损失。而快速对采集到的光谱数据进行定性分析是红外光谱分析技术中的关键环节。传统的光谱识别方法如谱库检索等对光谱信噪比要求极高,很难广泛使用。随着计算机科学技术的快速发展,尤其是机器学习算法在各种分类识别领域大放异彩,将机器学习算法与红外光谱识别相结合成为了红外光谱分析领域的研究热点之一。而在众多机器学习算法中,集成学习算法因其强大的学习能力和稳定性备受关注,但是在光谱识别领域鲜有应用。本文基于集成学习算法中的Boosting算法对危害气体红外光谱识别方法进行研究。本文的主要内容包括以下几个方面:(1)针对丙酮、对二甲苯、三氯甲烷、三氯乙烷、四氯乙烯五种实测的危害气体红外光谱数据中存在基线漂移、噪声干扰和光谱量纲差异过大等现象,使用“多项式拟合的光谱自动基线校正+Savitzky-Golay平滑滤波+归一化”方法对原始数据进行预处理。通过分析所选用的危害气体红外光谱数据的特征,选取半峰全宽、窗口相关系数、峰度、偏度、信噪比、最大值位置等参量构建了用于模型识别训练的光谱特征向量。(2)利用Adaboost.M2多分类算法,分别将BP神经网络和CART分类树模型作为基学习器,建立了 Adaboost-BP和Adaboost-CART两种光谱识别模型。使用预处理后的六类红外光谱数据和光谱特征向量对模型进行训练及性能验证。实验结果表明,Adaboost-BP和Adaboost-CART两种光谱识别模型的识别准确率均达到了 96%以上,训练集和测试集的识别准确率相关性分别为96.17%和98.39%,模型泛化能力较强。(3)使用Boosting算法中的最新研究成果—XGBoost算法,以CART回归树模型作为基学习器,搭建了基于XGBoost算法的红外光谱识别模型,利用光谱特征向量对模型进行训练和性能验证。实验结果表明,基于XGBoost算法的红外光谱识别模型识别准确率达到了 96.87%,且训练集和测试集相关性达到了 98.53%,表明了 XGBoost算法在红外光谱识别领域中具有良好的应用前景。