阐述机器学习在油气开发预测中的作用

jf_f8pIz0xS 2020-07-28 1645

人工智能

643人已加入

描述

机器学习主要作用是分类、回归、降维和聚类。在开发指标预测中主要是回归和降维。机器学习的主要理论基础就是使目标函数最小化，而目标函数主要由经验风险和结构风险组成。经验风险就是预测值和真实观测值的差异，结构风险则是由置信域决定的。置信域也就是推广性的界，主要是由维度大小和样本数量决定的。机器学习的算法有很多种，可以运用到指标预测和数模调参方面的算法主要包括支持向量回归机、随机决策森林、多元自适应回归样条、深度学习、k最近邻、核脊回归、协同过滤和概率矩阵分解、神经网络、随机梯度、广义回归神经网络等。

对于开发指标，主要对产量、物性参数进行预测。产量包括产水率、产气率、产油率和递减率等。物性参数主要包括油藏物理性质和流体性质。使用随机森林、多元自适应回归样条和支持向量回归机对递减率的进行预测，发现支持向量回归机SEDM预测最好。

对于产量预测，使用数模等数据驱动式模型预测比使用递减率预测准确。人工神经网络无法取代数据驱动式模型，但两者结合可以有更好的效果。

对孔隙度、渗透率等物性参数进行预测。对比传统地质概率方法、克里金法和机器学习，发现机器学习的耗时小、计算量小且准确度没有下降。

支持向量回归机由于原理和概率统计中的VC维和推广性的界相似，是重要的回归算法之一。首先选定输入数据，然后对数据进行粗糙化、归一化等预处理。第二步则是建立模型，选定核函数。第三部利用油产量差、气产量差、水产量差分别预测孔隙度和渗透率，再将预测的孔隙度和渗透率加入输入项的自变量中去预测误差较大的厚度。根据产量数据进行建模预测数模所需的调参数据。其中，进行数据空间映射的核函数对模型影响较大。径向基核函数的预测效果最好。

支持向量机由于核心是核函数的运用，所以可被称为单核函数，而多核学习则是支持向量机的一种推广，使用双回路来调整多核学习（MKL）油藏孔隙度（φ）和渗透率模型（k）：（1）内回路通过最大程度地减少静态模型的失配来优化输入特征的影响（2）外回路优化多核学习（MKL）参数，以最小化油藏模型响应的动态失配。MKL能够对所选的空间特征进行非线性混合。对于不同的油藏区域，需要选择不同的内核宽度。相比于单个核函数，多核模型可以具有更高的灵活性。经过多个核函数映射后的高维空间是由多个特征空间组合而成的组合空间，新的组合空间中能够得到更加准确、合理的表达，进而提高样本数据的分类正确率或预测精度。尽管多核学习在解决一些异构数据集问题上表现出了非常优秀的性能，但效率是多核学习发展的最大瓶颈。（1）空间方面（2）时间方面，高耗的时间和空间复杂度是导致多核学习算法不能广泛应用的一个重要原因。

利用深度学习和集合数据同化法进行历史拟合。使用一个深的自动编码器为架构，其基本思想是使用一组先前沉积相认识来训练DL网络，然后，利用隐层的系数（编码器的输出）作为历史拟合参数，利用ES-MDA分析方程进行调整，然后，基于初始训练（解码器），使用更新后的系数重建沉积相模型，也被称为ES-MDA-DL。根据PUNQ-S3案例，对比ES-MDA，ES-MDA-PCA发现。ES-MDA-DL也得到了定义良好的河道，保持了对数渗透率的双模型分布，得到的数据拟合质量与ES-MDA和ES-MDA-PCA得到的数据拟合质量相同。ES-MDA-DL和ES-MDA-PCA使用了降维技术、将数据降维并做高斯变化，这样解决了ES-MDA对于数据高斯性假设的依赖。同时这两种方法更新了沉积相和岩石物理性质，使得结果更准确。

对于可行性约束的油藏历史拟合，可使用基于KNN分类器来挖掘训练数据集中的特征空间。在保留形状与连通模式的同时更新曲流河河道以拟合观测数据是非常困难的，并且很难通过经典历史拟合方法去实现。采用机器学习方法，在保持复杂相连通的同时，提出一种复杂相模型自动历史拟合的框架。

GRNN模型比MARS模型和SGB模型具有更好的拟合质量。MARS模型在测试集上的结果表现比SGB和GRNN模型好得多。MARS、SGB和RF机器学习方法与GRNN方法不同，它们能够自动选择相关的输入特征。

总的来说，不同的机器学习算法、模型输入数据的处理与选择、参数和函数的选择与调节等因素共同决定了模型的效率及准确度。机器学习在开发指标的预测和数模调参方面有着广泛的运用。一些较新的算法，例如多核学习，还有待进一步提升。

打开APP阅读更多精彩内容