论文部分内容阅读
中药三七是五加科植物三七(Panax notoginseng)的干燥根及根茎,作为一种名贵的材,有散瘀止血、消肿止痛的功效。三七主产于云南,道地产区为云南文山。近年来商品三七种植由文山等传统产地大规模向新产区扩展,其盲目引种及扩大产区,致使药材的质量下降,中药的质量直接影响着整个中医药行业的发展。目前市场上售卖的三七有一部分产自文山,常常存在以其他产地三七冒充文山三七的现象。由于三七种植的独特性,每三年为一个周期,且需要轮流栽培种植以保持土壤微量元素的平衡,以期避免影响三七的质量。对于三七的现行评价方法如性状鉴别、紫外分光光度法、HPLC指纹图谱等,仍存在一些不足,如辨识度不高等问题,没有一套快速、准确的技术方法区分不同产地的三七。因此,探索并建立一种辨识度高且快速准确的区分不同产地三七的方法对三七的质量控制具有重要的理论和实践意义。本论文采用衰减全反射傅立叶变换红外光谱法(Attenuate total reflection Fourier transform infrared spectroscopy,ATR-FTIR)、傅立叶变换中红外光谱法(Fourier transform middle-infrared spectroscopy,FT-MIR)和傅立叶变换近红外光谱法(Fourier transform near-infrared spectroscopy,NIR)测得不同产地和不同干燥方法处理的三七的指纹图谱,结合随机森林(Random forest,RF)、支持向量机(Support vector machine,SVM)和系统聚类分析(Hierarchical cluster analysis,HCA)等化学计量学方法建立快速、简便而且有效的评价模型,对不同产地和不同干燥方法处理后的三七进行快速鉴别,为科学、规范的利用三七及质量评价提供一定的理论依据。1.采集云南省21个产地的210株三七的FT-MIR和NIR光谱,经过预处理后进行低、中和高级数据融合。与低级和中级数据融合结果相比,高级数据融合的结果更令人满意。FT-MIR光谱比NIR光谱在数据分析中的作用更大。随机森林用于建立分类模型。基于高级多传感器信息融合策略的随机森林Boruta模型(RF-Bo)和随机森林变量选择模型(RF-Vs)的结果令人满意。另外,基于高级多传感器信息融合策略的RF-Bo模型在数据分析中更快,更简单,准确率为95.6%。这表明基于特征变量筛选的高级数据融合结合FT-MIR和NIR光谱可以为三七的产地鉴别提供一种快速简便的方法。2.通过采用傅立叶变换红外光谱结合随机森林鉴别不同干燥方法处理的三七。以采自道地产区云南省文山州的三七为样本,建立随机森林变量选择模型(RF-Vs)和随机森林Boruta模型(RF-Bo)。对比发现随机森林Boruta模型正确率比随机森林变量选择模型的正确率更高,前者在运算过程中时间相对较短,操作简便。另外,随机森林Boruta模型的重要变量选择比随机森林变量选择模型覆盖范围更精确,数量相对较多。因此随机森林Boruta模型更适于鉴别不同干燥方法处理的三七。3.通过使用ATR附件、KBr压片技术和傅立叶变换近红外光谱仪分别采集三七的红外光谱数据。用云南省昆明市、红河州、文山州、玉溪市及曲靖市5个产地三七的FTIR、ATR-FTIR和NIR光谱数据集来分别建立随机森林单一光谱和随机森林低级融合判别模型,模型结果显示NIR光谱和ATR-FTIR光谱数据融合后建立的随机森林模型的正确率高,为三七的产地鉴别提供了简便、高效的技术方法。ATR-FTIR光谱技术省略了压片过程,操作无损耗,样品检测后可回收,相较于FTIR光谱技术在实际应用过程中具有很强的优势,节省时间而且试剂损耗少。4.通过采用傅立叶变换红外光谱结合化学计量学鉴别不同产地的三七。以采自云南省七个地州的三七为样本,光谱数据处理包括常见的光谱预处理,分析方法包括无监督鉴别和有监督鉴别分析。无监督鉴别运用了系统聚类分析,有监督鉴别模型用到了随机森林和支持向量机两种化学计量学方法。分析结果发现随机森林变量选择模型正确率和支持向量机鉴别模型正确率均为百分之百,但是后者在运算过程中时间相对较短,操作简便。同时结合无监督和有监督鉴别分析可以得出使用有监督鉴别分析才能得到更优的结果。