论文部分内容阅读
我国是农业大国,我国人口占世界总人口的18%,但是我国耕地只占世界现有耕地面积的9%左右。同时,我国是产量大国,也是粮食进口大国,此外,我国耕地也面临着质量退化、超负荷利用、化肥使用不合理、土壤重金属污染等诸多问题。我国对农业发展十分重视,十分珍惜和合理利用每寸土地,切实保护耕地,是我国必须长期坚持的一项基本国策。万物土中生,土壤是“绿水青山”的基础,土壤是农业的发展基础和生态环境的根基,土壤生态环境监测可以实时地掌握土壤的营养组成含量信息,并根据土壤营养成分含量信息进行合理的管理,逐步实现精准农业,土壤营养成分信息的实时测定是精准农业的关键环节。土壤有机碳对缓解全球气候变化具有多重意义,土壤有机碳对其他土壤样养分的影响很大,同时也影响到土壤物理和化学性质的稳定,对于农业的可持续发展十分重要。实时实地监测土壤环境会产生大量的样本,而传统的有机碳检测方法如化学氧化法和灼烧法,检测过程时间长,消耗大量的人力和财力投入。土壤高光谱技术作为一种新型的有机碳检测方法,具有样本处理简单、测量速度快和成本低的优势,应用前景良好,可以为农业生产服务。本研究利用高光谱(可见-近红外光谱,350-2500nm)估算滨湖地区(洪湖市)土壤有机碳含量,针对国内外学者在高光谱建模方法、野外和室内光谱对比分析以及全国光谱库应用研究中存在的问题和不足,探讨通过光谱变换对建模集构建进行改进,从而实现对建模方法的优化,并讨论建模中使用的光谱数据,包括野外和室内光谱,室内光谱又分为风干碾磨前和风干碾磨后光谱,探讨多种光谱数据对建模的影响,最后将全国光谱库应用到滨湖地区进行土壤有机碳含量的估算,在估算中考虑土壤类型信息等辅助信息,同时还研究Spiking技术和EW技术在全国光谱库应用中的作用,探索这两项技术能否达到较高的估算精度,并对Spiking和EW技术中的两个核心问题进行深入的研究,也就是Spiking的样本量大小和EW的倍数。根据以上系列研究得到如下结论:(1)通过结合光谱变换和选本选择算法实现了对滨湖地区有机碳含量估算方法的改进。目前国内外没有学者将光谱变换应用到建模集构建中,本研究提出将光谱变换应用到建模集构建中,对样本选择算法进行优化,从而选择出更具代表性的样本,最终达到对建模方法的改进。实验结果表明在构建建模集时,随着建模集中样本量的增加,有机碳估算模型的精度会不断地增加,但有时会保持稳定,原因是只有选择具有代表性的样本模型精度才会提高,如果只是选择和已选样本相似的样本,模型的估算精度不会增加。FD、Lg(1/R)、MSC和SNV四种光谱变换对建模集产生积极影响的比例分别为64%、78%、72%和75%,模型平均提高的ΔRPD分别为0.08、0.13、0.19和0.13,在大多数情况下,光谱变换能够优化建模集,从而提高有机碳估算精度。此外,光谱变换对建模集构建影响的比例和程度之间没有必然联系,也就是如果一种光谱变换对建模集积极影响的比例是很高的,这种光谱变换对建模集影响的程度不一定是最高的。光谱变换对建模集的优化,本质上是对样本间距离的改变,通过对样本间距离的增强或者削弱,从而让建模集中样本分布更加均匀,得到的估算模型更加稳定,实现对估算模型的改进。光谱变换最开始是为回归方法而设计,本文将光谱变换应用在样本选择算法中,通过比较光谱变换对样本选择算法和回归方法的影响,可以推断出光谱变换对回归方法的影响程度要高于其对样本选择算法的影响程度,而且光谱变换对样本选择算法的影响和对回归模型的影响之间没有必然联系,也就是如果一种光谱变换方法对回归模型有效,这种光谱变换方法不一定对建模集的构建有效。(2)滨湖地区野外和室内高光谱特征及其对有机碳估算的影响研究。在滨湖地区采集野外和室内光谱,室内光谱又分为风干碾磨前光谱和风干碾磨后光谱。土壤野外光谱在1350-1450nm、1800-2000nm和2300-2500nm处存在着反射率异常,反射率大于1,这可能是由于大气水泡对光谱的吸收和反射所造成的,光谱存在着较多的异常,利用土壤野外原始光谱建立有机碳含量估算模型,R~2cv是0.04,RMSEcv是18.82 g/kg,估算效果差,去掉异常波段之后,R~2cv是0.43,RMSEcv是4.89 g/kg,估算模型精度提高很大,在剔除异常样本后,R~2cv是0.54,RMSEcv是4.67 g/kg,估算精度进一步提高,因此在使用野外光谱进行有机碳估算需要剔除掉异常波段和异常样本。室内风干碾磨前,土壤光谱反射率几乎都在0.2以下,风干碾磨后,土壤光谱反射率都在0.2以上,并且光谱反射率变化范围变大,风干碾磨前和风干碾磨后的有机碳估算模型精度分别为R~2cv=0.51、RMSEcv=4.62g/kg和R~2cv=0.80、RMSEcv=2.90 g/kg、RPD=2.12,风干碾磨消除了土壤水分和颗粒大小不同而造成的影响,极大地提高了有机碳含量估算精度。在野外和室内光谱的对比中可以发现室内光谱受其它因素影响小,而野外光谱受到土壤水分和环境影响大,存在着异常光谱波段,只有部分光谱波段可用,野外光谱每个波段的反射率波动很大,野外光谱平均反射率要高于室内风干碾磨前光谱平均反射率。野外光谱估算有机碳含量的精度(决定系数为0.51)明显地低于室内光谱(决定系数为0.80),因此野外光谱估算精度需要进一步提升后才能应用到实际生产中。野外和室内光谱特征波段在350-850nm之间大部分是相似的,但是在其它波段差别很大。野外光谱最优的预处理方法是SG+SNV(R~2cv=0.554,RMSECcv=4.622g/kg),室内光谱最优的预处理方法是SG+MC,(R~2cv=0.831,RMSECcv=2.650g/kg),野外光谱对预处理方法更敏感,大多数情况下ΔRMSECcv的绝对值大于0.5 g/kg,而室内光谱大部分预处理方法ΔRMSECcv的绝对值都小于0.25g/kg,因此野外光谱可以选用合适的预处理方法来提高有机碳估算模型的精度,而室内光谱质量高,光谱预处理对估算模型的作用是有限的,此外,大多数光谱预处理方法对野外和室内光谱的作用是相同的,但不是绝对的,有些光谱预处理方法对野外和室内光谱的作用差别很大。(3)融合全国光谱库的滨湖地区土壤有机碳含量估算。在利用全国土壤光谱库时,传统做法是利用全体样本建立一个模型对滨湖地区所有土壤样本有机碳含量进行估算,RMSEP为5.921g/kg,Rp~2为0.609,RPD低于1,估算的误差很大,模型效果差的原因可能是全国光谱库中土壤样本类型多样,很多样本与滨湖地区土壤样本差异很大,这些样本将会干扰面向滨湖地区有机碳估算模型的建立。在对全国光谱库中的样本根据土壤类型进行分类后,分别建立估算模型,对滨湖地区土壤有机碳含量进行估算,其中使用全国光谱库中的水稻土(552个样本)建立的模型的精度最高,而研究区滨湖地区土壤类型主要也为水稻土,RMSEP为4.543g/kg,Rp~2为0.61,但RPD还是小于1.5。当使用Spiking技术时,随着Spiking的样本量由10个逐渐增加到50个,估算模型的Rp~2由0.655增加到0.753,RMSEP由4.373g/kg降低到3.68g/kg,RPD由1.438增加到1.709,Spiking对全国光谱库估算模型精度的提高很大,Spiking技术增加了全国光谱库与滨湖地区样本之间的相似性,让全国光谱库逐步适应对滨湖地区土壤有机碳的估算。在Spiking的基础上,引入了EW(extra-weighting)技术,也就是复制Spiking中的样本,建模集中就会出现很多相同的样本,当Spiking的样本量为10个,EW的倍数为128倍时,利用光谱库估算滨湖地区样本的RMSEP从4.251g/kg下降到3.18g/kg,如果只使用滨湖地区样本建立本地估算模型,RMSEP为2.907g/kg,Rp~2为0.802,使用EW技术让全国光谱库只需要很少的滨湖地区样本就可以达到滨湖地区本地估算模型的精度,此外,当Spiking的样本量为50个,EW的倍数为64倍时,光谱库模型的RMSEP为2.583 g/kg,Rp~2为0.864,此时估算模型的精度已经高于滨湖地区本地估算模型的精度(RMSEP=2.907g/kg,Rp~2=0.802)。当Spiking的样本数目相同时,随着EW的倍数的增加,模型精度开始提高很快,后来变缓,而且模型精度的提高是有极限的,不会随着EW的倍数的增加而无限地增加下去。当EW的倍数相同时,随着Spiking样本的增加,全国光谱库构建的滨湖地区土壤有机碳含量估算模型的精度会很稳定地提高。本研究成功地将全国光谱库应用到滨湖地区土壤有机碳含量的估算,估算的精度超出预期,甚至高于滨湖地区本地模型的估算精度。本研究是利用全国光谱库进行目标区域土壤有机碳含量估算的一个成功的案例,为以后全国光谱库的应用提供参考和借鉴。本研究针对滨湖地区土壤有机碳含量测定问题,采用土壤高光谱技术,在传统研究方法上的基础上,对估算建模方法进行改进,并讨论建模方法中数据源的问题(野外光谱和室内光谱),最后探索使用全国光谱库对滨湖地区土壤有机碳含量进行估算。本研究的实验区虽然只有洪湖市,但是研究的方法可以应用在全国不同的地区,此外,本研究为快速监测土壤信息提供实例和技术方法,实时实地获取土壤属性信息可以为农业管理者提供决策依据。