电子说
续上文
3、退化指示种识别与结果分析
3.1 识别目标波段特征分析
通过野外调查和现场样方照片可知,该实验区的植被主要为冷蒿,其他植被数量较少并且类型较多,混杂生长,难以获取单一物种植被的实地光谱信息。因此,将把实验区的地物分为3类,分别为裸土、冷蒿、其他绿色植被。
首先,使用训练样本管理器选择每个分类对象的训练样本数据;其次,在样本里提取了每个对象数据的平均光谱曲线,得到地物的真实的反射率数据;实测光谱曲线如图3所示。
图3 实测反射光谱曲线
由图3可知,在450~540nm范围内植被的光谱特征差异并不是很明显,在715~730nm范围内冷蒿与其他绿色植被的光谱曲线有混淆现象。由于存在光谱曲线的混线问题及难以分辨植被类型的问题。因此,通过原始光谱曲线进行微分变换和包络线去除变换(如图4和图5所示),放大植被波段之间的差异,减少植被之间的光谱曲线的混淆现象。
图4 微分变换曲线图
由图4可知,原始光谱曲线进行离散变量差分方程后,依然存在植被的光谱曲线的混淆的现象。
图5 包络线去除变换光谱曲线
故进一步包络线去除变换(图5)后,位于500nm处的吸收谷,550nm处的反射峰、670nm处的吸收谷,其他绿色植被和冷蒿的光谱曲线有明显的差异。为了能够有效地选择地物特征波段,进一步计算光谱反射率数据均值和标准差值,绘制了标准差的误差棒图,如图6所示。
图6 训练样本光谱特征曲线和标准差
由图6可知,在波段700~950nm范围内,两类植被的光谱反射率的标准差值重叠的,不参与植被识别中,故剔除重叠部分,以利于选出识别退化指示种的特征波段。经微分变换、包络线去除和计算标准差处理后,发现在500、550、670nm处有明显的差异,此3个波段满足了所选的波段信息具有较大的光谱差异的条件,故选取此3个波段作为特征波段并进行特征波段组合。特征波段组合数据对细小地物的纹理结构和图像的色彩差别增强,对退化指示种的识别成为可能。因此,在特征波段组合数据基础上,进行了模型的构建。
3.2 构建识别模型与验证
基于软件,特征波段组合数据为底图,结合实地调查数据,随机均匀的选取训练样本,如图7所示。
图7 训练样本分布图
在此基础上,采用随机森林和支持向量机作为分类器,选择合适的模型参数,对所选择的训练样本进行模型训练并分类,2种模型的分类结果如图8所示。
图8 支持向量机和随机森林分类结果
为了准确描述2种机器学习模型的分类精度,本实验采用混淆矩阵对独立验证样本的分类准确率进行评估。通过混淆矩阵得到分类影像的Kappa系数、生产者的精度、用户的精度和整体精度等评估指标,以量化2种模型的性能对分类准确率的贡献。本实验中验证样本一共选取了600个,与训练样本的比例为5∶3,对2种模型的性能进行评估,结果如表2和表3所示。
表2 支持向量机的混淆矩阵结果统计表
从支持向量机的混淆矩阵结果(如表2所示)可知,总体精度为96.92%,Kappa系数为0.95,分类中出现了冷蒿错分为裸土的有6个、其他绿色植被的有19个、裸土错分为冷蒿的有5个、其他绿色植被错分为冷蒿的有7个。因为裸土和其他绿色植被的光谱特征比较明显的差异,所以错分的现象不是很明显。
表3 随机森林的混淆矩阵结果统计表
从随机森林的混淆矩阵结果(如表3所示),得到的结果可以看出,总体精度为97.34%,Kappa系数为0.96。冷蒿和其他绿色植被之间错分数量有16例,这可能是因为选取训练样本时冷蒿与其他绿色植被之间混淆的现象。通过对2种分类方法的精度评价结果表明,随机森林的分类精度总体优于支持向量机的分类精度。故随机森林的识别分类效果更佳。
3.3 退化程度的评价分析
对分类识别结果进行像元统计计算,从结果(如表4)可知,冷蒿的面积占研究区的56.8%,其他绿色植被占39.5%。退化指示种的覆盖度达到了56.8%,从草地退化程度指标看,本实验区现状属于重度退化草地。
表4 像元统计表
为了准确表述退化指示物种和其他覆盖类型的聚集程度,为此,利用景观聚集度指数AI和分离度指数SPLIT对分别表征退化指示物种和其他覆盖类型的聚集和分离程度,其值越小,越紧凑。通过计算SPLIT指数和AI指数(如表5所示)可知,随机森林的SPLIT指数为3.7294,破碎度较强,支持。
表5 景观格局指数统计表
4、总结
本文对典型草原地物的光谱分析发现,裸土光谱曲线呈现吸收谷,这是由于研究区的裸土并不是完全没有植被的,故裸土光谱波段具有吸收谷。退化指示物种和其他绿色植被在可见光波段均表现为“低-高-低”的光谱反射率趋势,具有典型的植被光谱特征。由于高光谱数据波段数较多,会造成不必要的运算。
本文主要对比分析了传统的支持向量机和随机森林分类方法对典型草原退化指示物种识别的有效性。结果表明随机森林的分类结果表现优于支持向量机模型,这与杨红艳的实验结果一致。杨红艳等研究发现随机森林模型在30m的飞行高度可以较好地识别植被种类,随着飞行高度的增加,地物的空间分辨率和反射率降低,使识别较小的植被会有所难度。但本研究由于在50m的飞行高度,利用随机森林方法对典型草原植物进行分类并获了较高的识别精度,证明了50m的飞行高度,在识别植被方面研究中具有一定的可行性。研究结果精度相对较高的原因之一,是因为数据采集的时间是在8月份,这正是草原植物的生长旺盛期,光谱特征更加的明显,更有利于对草原物种的信息提取。
在分类器的选择中支持向量机的优点是小样本、结构风险最小化、具有更强的泛化能力,随机森林的优点是处理高维数据、训练速度快、实现比较简单。从分类结果上看是对退化指示物种的识别较好的分类器选择。支持向量机虽然比随机森林训练时间更短,训练参数更少,但是,该研究中支持持向量机相比随机森林的识别准确率较低,这说明随机森林模型更适合本研究并具有一定的可行性。具体结果如下所述:
(1)支持向量机和随机森林的分类整体准确率分别为96.92%和97.34%,Kappa系数值分别为0.9537和0.9600。随机森林效果为优。
(2)支持向量机的AI指数为95.0713,聚集程度较强,分类结果为聚集。随机森林的SPLIT指数为3.7294,破碎度较强,分类结果为分散,更贴切于实际。
(3)本实验中退化指示植物的面积占研究区的56.8%,超过重度退化指标,实验区现状属于重度退化草地。
本文所进行识别的地物类型较少,在今后的研究中,会扩大地域范围、增加植被类型、将实验区的植被更进一步精确分类;另外,选取的识别方法仅有随机森林与支持向量机两种,在下一步的研究中选择更多的分类方法进行对比,这也是未来研究发展的方向。
推荐:
便携式高光谱成像系统 iSpecHyper-VS1000
专门用于公安刑侦、物证鉴定、医学医疗、精准农业、矿物地质勘探等领域的最新产品,主要优势具有体积小、帧率高、高光谱分辨率高、高像质等性价比特点采用了透射光栅内推扫原理高光谱成像,系统集成高性能数据采集与分析处理系统,高速USB3.0接口传输,全靶面高成像质量光学设计,物镜接口为标准C-Mount,可根据用户需求更换物镜。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !