碳酸盐岩岩性高光谱识别及模型精度研究

电子说

1.3w人已加入

描述

碳酸盐岩是指碳酸盐矿物含量大于 50%的岩石类,代表性的碳酸盐岩主要有石灰岩、白云岩等,其中石灰岩的白云石含量位于 0~50%之间,白云岩的白云石含量高于 50%。目前,世界上众多重要产油气区的储集层都是以碳酸盐岩为主,因而其在世界油气探测中起着重要作用。

至今,碳酸盐岩岩性识别方法主要分为两类;其一是经验判读法,主要是具有丰富经验的地质学家在室内观察样品或者去野外通过观察岩石的颜色、纹理与结构等特征来对灰岩和白云岩进行区分。总体而言,经验判读法具有效率低、受判读者主观影响大等不足,因而即使对于经验丰富的地质学家,在野外有时也难以区分碳酸盐岩中的石灰岩与白云岩;其二是光谱识别法。由于物质在电磁波的照射下,其会引起岩石内部分子进行一定的运动,在吸收、散射或者转动某种波长的光后,得到信号强度与光波长或频率的关系图,并能够用于物质结构、组成及化学变化的分析,具体如图 1 所示。

光谱测量

图 1 信号强度与光的波长或频率的关系图

基于此原理,岩性光谱识别则是利用岩石或矿物对特定波长范围内的电磁波所表现出的反射、吸收和辐射等方面的差异性,从而对岩性进行识别。相比经验判断法,光谱识别法具有效率高、省时省力且精度较高等优点,因而得到了广泛的应用。专家学者研究表明在可见光-近红外光谱区(0.4~1.3 μm),岩石吸收光谱主要由于岩石内部金属阳离子发生电子跃迁或振动过程;发现在短波红外光谱区(1.3~2.5 μm),岩石吸收光谱则主要由于羟基、水分子和碳酸根等基团分子发生振动;他们展开了通过多类型光谱特征对矿物信息进行遥感识别、以北方山山口地区为研究区,对典型蚀变岩矿的光谱特征进行分析、结合遥感技术,对地质岩石进行勘查与分析等多项研究分析活动;此外,他们还有利用多光谱遥感影像对尾亚杂岩体的岩性进行识别。通过对已有研究文献进行归纳,总结得到不同光谱波段可识别的矿物,具体如表 1所示。

表1不同矿物波段识别范围

光谱测量

光谱测量

根据表 1 可以得到,不同的矿物识别波段差异较大,其中部分矿物识别波段相对较窄,比如方解石等,其波段识别范围为 2.26~2.30  μm。因此,传统的多光谱遥感因其波段范围较大,光谱分辨率低等原因难以高精度地识别矿物;相比之下,高光谱因具有光谱分辨率高等优势,甚至达到 2 个纳米波段,因而与多光谱相比,识别精度更高。当然,高光谱数据在运用时也需要一定的预处理方法。目前,常用的预处理方法包括光谱反射率微分、连续统去除和其他数学变换方法。专家学者研究表明不同光谱变换方式的建模精度和预测精度具有以下关系:光谱对数微分>光谱一阶微分>光谱倒数微分>光谱连续统去除>光谱倒数对数>原始光谱;然而该预测精度的排序并非全然一致的,仍需要通过具体的建模精度进行综合判断,如某专家在研究可见光-近红外光谱的成分预测时,尽管对光谱进行导数运算能够消除光谱中基线的平移和漂移,能够减轻粒径干扰,然而在实际运用时,若样本前处理效果得当,使用原始吸光度光谱的预测精度更好。另外,除对高光谱数据进行预处理外,光谱变量挑选和模型方法的选取也是重要环节。其中,光谱变量挑选涉及到从几百甚至几千个光谱波段变量中挑选出敏感波段,因为大多数变量与所研究的岩性种类无关。事实上,光谱变量筛选主要包括三个目的:剔除无效信息变量;滤除冗余信息变量;消除共线性信息变量。目前,常用的光谱变量筛选方法包括遗传算法、非信息变量消除法、连续投影算法、竞争自适应重加权采样算法(CARS)、迭代变量子集优化算法(IVSO)、蒙特卡洛无信息变量消除集成算法(EMCUVE)等。在模型选取方面,主要包括主成分回归法(PCR)、偏最小二乘回归法(PLSR)和连续小波变换(CWT)等。然而,每种方法都存在各自的优缺点。比如有些专家学者研究表明偏最小二乘回归法可以提供多对多变量的线性回归建模,能够很好地解决多重共线性问题;有些研究表明运用多特征波段构建的逐步模型精度较高。总体而言,已有高光谱建模研究中,并未有相对统一的光谱预处理方法、敏感波段挑选方法以及建模方法。由于不同的方法拥有各自的优缺点,因而在实际应用中,仍然采用尽可能全面的处理方法,从而对比分析不同方法建模的精度。因此,本文从岩性识别的角度出发,以不同类型碳酸盐岩的高光谱曲线为基础数据,通过对高光谱数据进行预处理等操作,从而建立有效的岩性识别模型,为区域地质勘探和油气勘探及开发提供快速准确的分类方法。

1数据获取、预处理及模型确定 

1.1 碳酸盐岩高光谱数据采集本研究去野外总共采集 340 块碳酸盐岩样本,并在实验室内采用非成像光谱仪测量岩样光谱。在具体实验室测量时,为确保高光谱数据的准确性,在测量前对其进行白板定标,并对每一个碳酸盐岩样品新鲜表面测量多次,最终取其算术平均值作为该样品的反射光谱数据。

1.2 光谱数据预处理碳酸盐岩样本在野外采集后,由于岩石样本受其化学成分、外部环境、表面特征和照射条件等因素影响,因此为排除外部因素影响,需要对其光谱数据进行预处理操作,从而去除噪声和不平滑的光谱曲线波段,从而采用更加适合分析的光谱曲线。本文通过对已有研究进行整理,所采用的光谱预处理方法包括 Savitzky-Golay 卷积平滑滤波、趋势线(DT)和连续统去除(CR)等。其中 Savitzky-Golay卷积平滑滤波法是采用一个多项式来计算波长 t 处经过平滑处理后的均值,其计算公式如式(1)所示。

光谱测量

式中,hi 是 Savitzky-Golay 平滑系数,H 被称为归一化因子。平滑系数可以通过多项式拟合计算。Savitzky-Golay 平滑方法强化了中心波长点的作用,其能够降低噪声,提高光谱信噪比。此外,本文在进行预处理后,为研究不同光谱采样间隔对模型精度的影响,分别将光谱重采样间隔为 0 nm、2 nm、4 nm、6 nm、8 nm 和 10 nm,其中 0 nm 即是原始光谱,从而最终得到 6 份不同采样间隔的高光谱数据。

1.3 模型的确定与精度评价根据对现有相关研究模型进行整理与对比分析,本文最终选择以下四种建模方法,分别为多元线性回归模型(MLR)、主成分回归模型(PCA)、偏最小二乘回归模型(PLSR)和逐步回归模型(SR)。具体而言,多元线性回归模型是将 Y 的总体条件期望表示为多个解释变量的函数;主成分回归模型是通过提取彼此之间正交的主成分分量,并同时建立线性回归预测模型,本研究中所使用的主成分分量数为 5;偏最小二乘回归模型是考虑与因变量相关性情况下的最小二乘算法,是通过投影分别将预测变量和观测变量投影到一个新的空间,并建立新的线性回归模型的过程;逐步回归模型是指用被解释变量对每一个待研究的解释变量做简单回归分析,使用贡献最大的解释变量对应的回归方程为基础,并按照贡献大小的顺序逐个引入剩余的解释变量。模型确定后,需要对模型的精度进行检验。本文利用决定系数(R2)对模型的稳定性进行评价,R2取值范围为 0~1,其值越大,表明模型稳定性越强,模型拟合程度越高;利用均方根误差(Root Mean Square Error,RMSE)对模型的预测能力进行评价,RMSE 越小,表明预测值和真实测量值之间的偏差越小,模型的预测能力越强,其计算公式如式(2)所示。

光谱测量

式中,N 为样本集包含样本的总数目,y(i)realy和y(i)predicty分别表示第 i 个样本的真实值和利用模型建立的预测值。 经过对光谱数据进行处理、模型确定与精度评价等步骤,最终可得到本文的技术路线图如图 3 所示。

光谱测量

图 3  研究技术路线图

2结果与分析 

2.1 光谱预处理结果对比 经过预处理后,选择单个样品将其结果进行对比显示,具体如图 4 所示。

光谱测量

(a)预处理前                           (b)预处理后

图 4  碳酸盐岩样品高光谱曲线预处理前后对比

根据图 4 可以发现,经过预处理操作后,碳酸盐岩光谱典型吸收特征被放大,进而更加突出土壤光谱吸收显著的区域,具体包括 1500 nm、1900 nm和 2300 nm 处附近。

2.2 建模精度对比评价表 2 是建模集中各模型精度对比表。

表 2  模型总体精度对比分析表 

光谱测量

 

光谱测量

根据表 2 可得,从各模型平均精度来看,主成分分析模型(PCA)>偏最小二乘回归模型(PLSR)>逐步回归模型(SR)>多元线性回归模型(MLR),其中主成分分析模型平均精度为 75.19%;从各采样间隔模型平均精度来看,各采样间隔模型精度排序为 4 nm>2 nm>0 nm(原始光谱)>6 nm>8 nm>10 nm,可得在采样间隔为 4 nm 时候,光谱模型平均精度最高(74.43%)。整体而言,各模型平均精度为 71.62%。为了解各模型建立方法的精度随光谱采样距离的变化趋势,结合表 2,绘制得到各模型精度变化折线图(图 5)。

光谱测量

图 5  不同模型不同光谱采样间隔精度变化 

根据图 5,可以发现虽然在 4 nm 时,四种建模方法平均精度最高,但并非所有模型都在 4 nm 时,模型精度最高。具体而言,主成分分析模型(PCA)和逐步回归模型(SR)在采样间隔为 2  nm 时,模型精度最高;而偏最小二乘回归模型(PLSR)和多元线性回归模型(MLR)在采样间隔为 4  nm 时,模型精度最高。综合分析可得,主成分分析模型(PCA)在光谱采样间隔为 2 nm 时,模型精度最高,为 79.78%,接近于 80%;而多元线性回归模型(MLR)在对原始光谱曲线进行建模时,精度最低,为 64.34%;另外,光谱采样间隔为 10  nm 时,四种模型构建方法精度均较低,均低于 70%。

3结  论

本研究通过对野外采集的 340 块碳酸盐岩样品进行高光谱测量,经过光谱预处理及光谱重采样等操作后,选择四种方法进行模型的构建。通过对结果进行分析,得到如下结论:(1)主成分分析模型在光谱采样间隔为 2  nm 时,具有最高的模型精度(79.78%),其次是采样间隔为 2 nm 时的逐步回归模型(76.61%),最后是采样间隔为 4 nm 时的偏最小二乘回归模型和多元线性回归模型,其精度分别为 73.48%和 73.21%;(2)随着光谱采样间隔的增加,四种模型的精度均基本表现为先增加,后下降的变化趋势;(3)当光谱采样间隔较大时,所有模型精度均低于 70.00%。然而,本研究也存在一定的不足之处,首先是所有模型的精度均未超过 80%,其次是模型的预处理过程相对较粗糙,未能使得模型构建精度更高。总体而言,本研究可为区域地质判断及油气区识别等提供有效的技术和方法手段。

莱森光学(深圳)有限公司是一家提供光机电一体化集成解决方案的高科技公司,我们专注于光谱传感和光电应用系统的研发、生产和销售。

审核编辑 黄昊宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分