论文部分内容阅读
三七(PN)作为一种名贵的中药,由于其巨大的药用价值而需求量日益增加。然而,三七生长条件苛刻、资源短缺,导致三七价格持续走高。市场上经常出现外观与三七相似的伪品掺入三七中,如莪术(RC)、姜黄(CL)和高良姜(RAO)等。中药成分复杂,如何对三七及其相似品鉴别和掺伪定量分析是一个难点。近红外光谱和紫外-可见漫反射光谱由于无损、快速、操作简单等特点被广泛用于复杂样品定性和定量分析。本文探讨近红外光谱和紫外-可见漫反射光谱结合化学计量学对三七及其相似品进行鉴别和掺伪定量的可行性。具体研究内容如下:1.近红外光谱结合化学模式识别对三七及其相似品的鉴别。从天津市药店购买三七样品25个,莪术、姜黄、高良姜样品各28个,共109个样品。将每个样品分别磨粉、过120目筛子后,直接采集样品的近红外光谱。根据Kennard and Stone(KS)算法将样品分为70个训练集样品和39个预测集样品。比较系统聚类分析(HCA)、偏最小二乘-判别分析(PLS-DA)、人工神经网络(ANN)、支持向量机(SVM)和极限学习机(ELM)五种模式识别方法对109个中药样品的鉴别能力。利用训练集样品确定最佳参数并建立分类模型,再对预测集进行预测。结果显示,PLS-DA和SVM可以实现对三七及其三种相似品100%的准确鉴别。2.近红外光谱结合多元校正对多元掺伪三七样品中三七组分的定量研究。首先设计了7个不同组成的掺伪三七样品的数据集,其中三七分别与莪术、姜黄和高良姜三种伪品的二元掺伪数据集3个,三元掺伪数据集3个以及四元掺伪数据集1个,按照整体顺序局部随机的分组方式把每个数据集分为2/3的训练集和1/3的预测集。利用每个数据集的训练集样品分别建立主成分回归(PCR)、偏最小二乘回归(PLSR)、支持向量回归(SVR)、ANN和ELM五种模型,并比较五种模型对预测集掺伪三七样品中三七组分预测效果。综合考虑预测精度、是否过拟合和计算效率后发现,无论对于几元掺伪三七进行预测,PLSR都是最佳校正模型方法。在此基础上,考虑光谱预处理对预测结果的影响,发现适当的预处理方法可以进一步提高PLSR模型的预测性能。3.紫外-可见漫反射光谱结合化学模式识别对三七及其三种相似品进行鉴别。首先采集三七、莪术、姜黄、高良姜四种中药共109个纯样品的紫外-可见漫反射光谱。根据KS算法将109个样品分为70个训练集样品和39个预测集样品。然后利用训练集样本进行参数优化,并建立HCA、PLS-DA、ANN和SVM四种模式识别方法下四种纯样品的鉴别模型,再对预测集样本进行鉴别。结果显示,PLS-DA是一种准确的鉴别方法,预测准确率可以达到100%。4.紫外-可见漫反射光谱结合多元校正对四元掺伪三七的定量研究。首先设计三七、莪术、姜黄、高良姜四种中药的75个不同组成比例的四元掺伪三七样品,并采集紫外-可见漫反射光谱。根据KS算法将样品分为50个训练集样品和25个预测集样品。然后根据蒙特卡洛交叉验证结合F检验确定PLSR的最佳因子数,利用训练集样本建立PLSR模型。同时考虑六种预处理方法和三种变量选择方法对建模的影响。结果表明,结合适当的预处理和变量选择方法能够提高模型的预测性能,最终对于预测集样品的每种组分进行预测,相关系数Rp均在0.98以上。