电子说
四、基于机载高光谱山区耕地土壤有机质含量反演算法研究
4.1敏感波段选择
根据无人机高光谱SOM相关系数图和敏感波段范围图分析得出,基于原始光谱和4种光谱变换(一阶微分(FD)、二阶微分(SD)、倒数对数的一阶微分(LRD)和连续统去除(CR))与SOM的相关分析分别有80、20、11、12、10个波段通过显著检验(p>0.01),其中原始光谱显著相关的波段数量最多,少部分在可见光区,多数集中在近红外光区,其他四种变换显著相关的波段均分布在可见光-近红外区间。5种不同的光谱形式经筛选最终各确定10个相关系数值较大的敏感波段作为建模的自变量,见表4-1。
表 4-1 机载高光谱敏感波段入选表
4.2 基于敏感波段的山区耕地土壤有机质含量反演模型
4.2.1PLSR土壤有机质反演模型
表4-2是山区耕地SOM含量机载高光谱反演的不同光谱变化和PLSR的模型组合,从中可知,所有训练集的模型精度基本和验证集持平,这可能跟二者样本数量相同有密切联系。分析5种类型光谱与PLSR组合的模型中,FD-PLSR、SD-PLSR、LRD-PLSR等模型的RPD均大于1.4,其中拟合优度表现最为良好的是FD-PLS(R2T=0.603,RMSET=4.563;R2V=0.656,RMSEV=5.337,RPD=1.476),并且验证集精度高于训练集,所以FD-PLSR模型能达到预测山区土壤有机质含量的基本要求,而SD和LRD光谱变换模型的决定系数偏低(0.501<0.6,0.534<0.6),不适用于山区耕地SOM反演;基于原始光谱的回归模型精度较低,即使经过相关分析入选敏感波段的数量最多,但容易造成建模过程中自变量共线问题,一方面跟机载光谱仪扫描波段范围受限有关,另一方面说明与山区耕地SOM有关的波段不仅限于近红外区间;基于PLSR模型组合中精
(R2T=0.310,RMSET=6.546;R2V=0.314,RMSEV=8.441,RPD=1.106),推测跟敏感波段数量少不能充分挖掘山区土壤信息有关。
表4-2 机载高光谱土壤有机质反演模型精度表(PLSR)
基于50个厢面土样作为验证样本绘制实测值与预测值的散点图进行验证(图4-1),发现经过FD变换的数据与原始数据相比决定系数R2有明显提高,SD和LRD有略微提高,CR变化的精度降低,这表明FD、SD和LRD的数据变换有增强可见光和近红外波段的特质,让SOM光谱敏感波段的数量增加,建模精度得到提高。分析CR变换可以放大山区土壤光谱反射率之间的差异,同时能提高光谱与有机质在可见光部分的相关性,但机载高光谱自身反射率整体偏低的原因,导致CR变换在突出光谱曲线的吸收、反射特征的效果一般,所以提取敏感波段少,模型精度低。
图 4-1 PLSR模型实测值-预测值散点图
综上,通过训练集和验证集各项验证指标分析发现,基于无人机高光谱PLSR土壤有机质含量预测模型中,FD-PLSR模型具有对山区SOM基本的估测能力,其余模型变换组合预估能力较差不能作为山区耕地SOM反演的备用模型;在数据变换方面,能提高模型精度的大小依次是FD>LRD>SD>CR。
4.2.2SVM土壤有机质反演模型
表4-3是山区耕地SOM含量机载高光谱反演的不同光谱变化和SVM的模型组合,分析5种光谱类型与SVM组合的模型中,FD-SVM、SD-PLSR和LRD-SVM等模型的RPD均大于1.4,其中拟合优度表现最为良好的是FD-SVM
(R2T=0.782,RMSET=3.211;R2V=0.741,RMSEV=4.573,RPD=1.758),并且训练集和验证集决定系数R2均超过0.7,这代表FD-SVM模型对山区土壤有机质含量有不错的预测能力,SD和LRD数据变换组合模型同样达到预测山区土壤有机质含量的基本要求,而原始光谱R与SVM组合模型的决定系数偏低(0.512<0.6),不适用于山区耕地SOM反演;基于CR与SVM组合的回归模型精度最低
(R2T=0.502,RMSET=5.564;R2V=0.444,RMSEV=7.365,RPD=1.211),尽管与CR-PLSR模型精度相比有明显提高,但敏感波段少且入选波段范围单一始终难以达到SOM反演的基本要求。
表4-3机载高光谱土壤有机质反演模型精度表(SVM)
分析SVM模型实测值与预测值散点图(图4-2)发现除了CR变换以外的其余3种数据变换的模型精度均大于原始精度,与原始相比较,FD决定系数R2提高了0.085,是无人机高光谱效果最佳的SVM模型,因为FD处理不仅可以消除背景噪声的干扰,提高光谱分辨率和灵敏度,还易找到相关性高的波段;SD决定系数R2提高0.13,跟FD对比有所下降的原因是SD光谱变换与SOM的相关分析通过显著性检验(p>0.01)的波段过于紧密,导致自变量间多重相关,主成分信息重复,模型反演难以达到理想效果;LRD决定系数R2提高了0.145,这可能跟LRD结合了一阶微分和倒数对数的优点,在提高光谱分辨率的同时减少因光照引起的乘胜性因素影响,寻得可见光-近红外范围含有山区SOM的敏感波段,使得建模精度有所保障。
图4-2 SVM 模型实测值-预测值散点图
综上,根据各项验证指标和散点图分析发现,基于机载高光谱SVM土壤有机质含量预测模型中,FD-SVM模型具有对山区SOM良好的估测能力,以SD和LRD数据变换与SVM组合的模型预估能力能达到基础水平;SVM不同组合模型精度均优于PLSR,在数据变换方面,能提高模型精度大小的光谱变换与PLSR结论相同。
4.2.3RF土壤有机质反演模型
表4-4是山区耕地SOM含量机载机高光谱反演的不同光谱变化和RF的模型组合,与PLSR和SVM模型相比,RF整体精度有显著提高。在训练集中,FD-RF和SD-RF决定系数R2首次突破0.8,达到估测稳定模型系列,而在以往CR变换组合的模型里也是首次达到预测SOM的基本要求(0.642>0.6)。在验证集里有R-RF、FD-RF、SD-RF和LRD-RF等模型的RPD均大于1.4,在所有RF组合的模型中,模型拟合优度表现最为良好的是
(R2T=0.843,RMSET=2.876;R2V=0.758,RMSEV=4.139,RPD=1.928),并且训练集和验证集决定系数R2差距不大,这表明FD-SVM模型对山区土壤有机质含量有良好的预测能力;SD-RF模型精度首次高于LRD-RF(0.731>0.659),对于SD光谱变换密集出现的吸收谷和反射峰,RF模型具有一定抗噪声能力,它能判断不同特征波段之间相互影响程度,对自变量适应能力强,通过决策树不断优化训练效果,提高模型精度;CR-RF模型精度(R2T=0.642,RMSET=4.113;R2V=0.519,RMSEV=6.741,RPD=1.316)。
表4-4机载高光谱土壤有机质反演模型精度表(RF)
结合RF模型训练集与验证集对比分析发现两者精度差均高于PLSR和SVM模型,前者拟合优度良好且稳定,属于4种模型里的最优选择,这与前人研究基本一致,散点图(图4-3)以FD和SD变换效果良好,LRD-RF精度与同等反演模型组合的验证集精度相距甚远,离散程度大,造成验证集精度差异大的原因可能跟样本数量有很大关系,本文在无人机高光谱建模选择的自变量偏少,这跟入选显著相关特征波长偏少有关,同时也说明随机森林更适合多变量的数据样本进行建模。
图4-3 RF模型实测值-预测值散点图
综上,根据土壤有机质光谱反演模型精度表和散点图综合分析得出,基于无人机高光谱RF土壤有机质含量预测模型中,FD-RF模型具有对山区SOM良好的估测能力,以SD光谱数据变换与RF组合的模型同样具备对山区SOM含量预测的能力;RF不同组合模型精度均优于PLSR和SVM,在数据变换方面,能提高模型精度的大小分别是FD>SD>LRD>CR。
4.2.4BP神经网络土壤有机质反演模型
表4-5是山区耕地SOM含量机载高光谱反演的不同光谱变化和BP神经网络的模型组合,对比PLSR、SVM和RF模型发现,BP模型稳定性更好,表现在验证集与训练集精度差距最小,与RF相比具有明显优势,在四类模型中预测机质效果更好,整体精度相对提高,原因是BP具有完整数学算法,可通过调整训练参数优化模型精度,在一定程度上实现对任意非线性函数运算出最优解。
表4-5机载高光谱土壤有机质反演模型精度表(BP)
分析5种类型光谱与SVM组合的模型中,所有组合模型的RPD均大于1.4,BP建模效果最佳的模型组合是FD-BP和LRD-BP,其中一阶微分与BP神经网络组合的预测(R2T=0.805,RMSET=3.012;R2V=0.773,RMSEV=4.085,RPD=1.968)
验证集的决定系数接近0.8,相对分析误差接近2,在四类模型中精度最高,这意味着FD-BP模型对山区土壤有机质含量具有更加良好的预测能力,其余组合模型只达到预测山区土壤有机质含量的基本要求,而原始光谱与SVM组合模型的决定系数偏低(0.595<0.6),不适用于山区耕地SOM反演;基于CR与BP
组合的回归模型精度最低
(R2T=0.586,RMSET=4.851;R2V=0.554,RMSEV=6.242,RPD=1.371),说明CR光谱变换组合的模型并不适用于山区耕地SOM预测。
BP神经网络预测模型的整体能力最高(图4-4),其中原始光谱R和经过FD、LRD数据变换的BP模型的决定系数均在0.75以上,与它们对等的训练集差距进一步缩小,以FD-BP组合的模型预测精度离散化最低,这说明BP模型在预测SOM含量方面具有较高的稳定性;以R-BP、CR-BP组合的预测模型离散程度最大,这说明山区土壤蕴含有机质信息的波长范围宽,同时说明模型不是决定预测效果的唯一因素。
图4-4 BP模型实测值-预测值散点图
通过综合训练集和测试集各项验证指标分析发现,在不同变换的光谱数据与模型组合中,FD-BP模型具有最稳定的估测能力,其次是LRD-BP、R-BP、FD-RF、SD-RF和CR-RF模型有良好的预估能力;在数据变换方面,能提高模型精度的大小依次是FD>LRD>SD>CR。在模型选择方面,更适合山区SOM反演的模型依次为BP>RF>SVM>PLSR。
4.3 模型精度对比
通过实验对比分析得出,敏感波段所构建的模型精度优于全波段,说明敏感波段更适合于山区SOM含量估测研究。按精度验证指标(R2、RMSE、RPD)结果得出,以FD-BP反演模型精度和估测能力最高
(R2T=0.805,RMSET=3.012;R2V=0.773,RMSEV=4.085,RPD=1.968),全波段同样是FD-BP反演模型精度和估测能力最高
(R2T=0.782,RMSET=3.336;R2V=0.761,RMSEV=4.124,RPD=1.933),两者在提高模型精度的光谱变换研究一致,即FD>LRD>SD>CR,最适用于山区SOM反演的模型都为BP神经网络。
表4-6最佳反演模型精度表
五、结论
(1)无人机高光谱和地物光谱均具有估测SOM含量的能力。其中无人机高光谱影像具有检测山区SOM的基本能力,地物光谱具有极好的定量预测SOM含量的能力;
(2)贵州山区土壤的高光谱数据通过光谱预处理和4种光谱数据变换在不同程度上提高它们与SOM之间的相关性,其中一阶微分变换可充分挖掘山区土壤信息,通过显著性检验的波段高达941个,相关系数最高达到-0.654;
(3)与SOM进行相关分析得出的敏感波段数量越多且范围(可见光-近红外)越宽,其构建的模型效果越好,说明通过相关系数由大到小的原则在光谱有效范围内均匀筛选的波段不仅能代表土样信息,还能在建模时减少自变量之间多重相关等问题;
(4)在估测山区耕地SOM含量方面,PLSR具有粗略的估测能力;SVM模型对山区耕地SOM估测相对PLSR有明显提高;RF优于前两者但验证模型精度不是最佳;非线性模型中BP神经网络以其精度高稳定性好适用于山区耕地SOM估测,以一阶微分-BP神经网络预测效果最优(训练集:R2=0.852,RMSE=2.534;验证集:R2=0.878,RMSE=3.315,RPD=2.425),对于贵州多山区SOM监测更具备普适性。
推荐:
便携式高光谱成像系统iSpecHyper-VS1000
专门用于公安刑侦、物证鉴定、医学医疗、精准农业、矿物地质勘探等领域的最新产品,主要优势具有体积小、帧率高、高光谱分辨率高、高像质等性价比特点采用了透射光栅内推扫原理高光谱成像,系统集成高性能数据采集与分析处理系统,高速USB3.0接口传输,全靶面高成像质量光学设计,物镜接口为标准C-Mount,可根据用户需求更换物镜。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !