论文部分内容阅读
传统对茶叶的品种识别主要通过叶片的特征,这种方法需要一定的经验累积;对于茶叶的品质鉴定则需要通过各种化学实验来实现,整个过程操作繁琐、费时费力且成本较高;高光谱可以探测地物间细微的差异,包含的信息丰富,将高光谱技术应用于茶叶的品种识别和品质鉴别具有现实意义。研究茶叶高光谱特征,需要大量的实测数据作为支撑,建立茶叶高光谱数据库,实现对收集的不同茶叶的光谱数据的存储、管理和共享是高光谱技术在茶叶品种品质研究的基础。本论文通过采集茶树冠层和采集的茶叶样本的光谱数据,利用PyQt5.6、numpy等和PostgreSQL 9.5开发和建立高光谱数据库应用系统。利用SVM-RFE和Elastic Net算法研究鲜茶叶光谱特征,并将这些特征利用SVM和随机森林来进行茶叶品种识别。本文的主要成果如下:1)建立茶叶高光谱数据库应用系统结合实际分析目标用户的需求,设计系统的业务流程、系统的各个模块、系统架构、数据规范和数据库结构。在PostgreSQL 9.5中建立茶叶高光谱数据库,采用C/S架构,利用PyQt5.6、numpy等python库实现茶叶高光谱数据库系统,该系统包含对ASD FieldSpec3数据存储、管理和显示等功能。针对数据的应用需求,系统集成了 SG平滑、光谱微分、光谱倒数对数变换、光谱特征参量(如红边参数等)的提取、计算光谱指数(可以自定义光谱指数)等功能,实现了对茶叶光谱数据的处理;对实测数据的“挑线”过程的繁琐,提出了基于经验阈值的自动挑线算法,利用这个算法可以让数据预处理时间大幅缩短。系统还提供了对本地数据与数据库数据无缝衔接,可以对这两者的数据进行同步处理分析;对数据的导出可以实现按照指定波段范围,将两者的数据导出到同一个CSV文件中。2)茶叶高光谱数据库应用示范从茶叶高光谱数据库选择于2014年10月8日实测的9种鲜茶叶高光谱数据,对9种鲜茶叶数据,通过系统集成水吸收波段去除、SG平滑等预处理,并计算24种光谱指数,用SVM-RFE和EN对光谱反射率数据和光谱指数数据进行特征选择,最后用线性SVM和随机森林分类。结果表明SVM的性能优于随机森林,SVM-RFE和EN是稳定有效的特征算法。两种特征选择算法的结果有一定的重合性,也存在差异。在SVM分类器中,总体精度都在90%以上,但在随机森林分类器中,光谱波段特征效果不好,仅有70%左右,但在光谱指数特征有90%以上的精度。