智能石油工程丨Engineering

本文选自中国工程院院刊《Engineering》2022年第11期

作者：Mohammad Ali Mirza, Mahtab Ghoroori, Zhangxin Chen

来源：Intelligent Petroleum Engineering[J]. Engineering,2022,18(11):27-32.

编者按

近年来，在新一代信息技术快速渗透和带动下，石油和天然气行业正迅速向数字化网络化智能化方向转型，人们越来越倾向于将数据驱动建模和机器学习（ML）算法应用于应对各种石油工程挑战。

中国工程院外籍院士陈掌星等在中国工程院院刊《Engineering》2022年第11期发表《智能石油工程》一文。文章指出ML已广泛应用于石油工业的不同领域，包括地球科学、油藏工程、生产工程和钻井工程，但将ML算法应用于石油工程问题仍然需要克服各种挑战，此外ML的潜力在石油工业油藏模拟和文本挖掘这两个领域尚未得到充分利用。

一、引言

人工智能（AI）试图模仿人类的决策。被称为机器学习（ML）的AI技术子集使计算机能够通过使用外部数据，学习如何在其编程行为的限制之外采取行动。ML已彻底改变无数行业和研究领域，从股票市场分析到自动驾驶汽车行业，其应用范围极其广泛。随着物联网（IoT）设备和大数据（高速生成大量、不同种类的数据）的出现，ML是确保从大数据中获取可执行信息的最重要技术之一。

在石油和天然气行业，模型类型分为三大类：物理模型、数学模型和经验模型。物理模型是对象的按比例缩小或放大版本，开发物理模型是为了简化对物理对象或场景的外观或操作方式的认识。这些模型具有开发成本高、耗时长的缺点，并且在某些情况下可能不够准确。根据实验建立了经验模型，经验模型会出现各种误差，如人为误差和测量误差，并且无法归纳。数学模型对物理定律进行编码，以模拟基础物理学；然而，它们需要许多假设和简化。为了应对这三种模型所面临的挑战、获取信息，并及时做出明智的决策，需要一种更有前景的技术。这就是ML可以应用之处，一是因为该技术能够从庞大数据集中获取信息并对该信息采取行动，而这些信息永远无法通过纯编程程序进行处理；二是因为数据与从数据中获取的信息之间的关系非常复杂。

石油和天然气行业正在迅速向油田数字化转型，人们越来越倾向于将数据驱动建模和ML算法应用于应对各种石油工程挑战。数据驱动建模使用从数据分析中导出的数学方程，而不是知识驱动建模。在知识驱动建模中，逻辑是用于表示理论的主要工具。虽然可能有不从数据中学习的数据驱动算法（因此不能称为ML），但ML是数据驱动方法的一个子集，该方法展示了AI的一种形式。图1总结了不同类型的ML算法。

图1 不同类型的ML算法。DBSCAN：基于密度的噪声应用空间聚类；HDBSCAN：基于层次密度的噪声应用空间聚类。

ML已广泛应用于石油工业的不同领域，包括地球科学、油藏工程、生产工程和钻井工程。接下来的4节将对ML在这些领域的应用进行批判性的回顾和展望。

（一）智能地球科学

早在20世纪60年代，地球科学已经开始利用决策树、马尔可夫链和K均值聚类等算法。马尔可夫链已用于沉积学、水文学和测井分析。Preston和Henderson使用K均值聚类来解释泥沙沉积的周期性。决策树的早期应用可以在经济地质学和透视映射中查到。由于多种因素，包括缺乏计算能力和该领域的不成熟，采用ML未能完全满足最初的期望；因此，AI在20世纪70年代几乎没有得到发展。Zhao和Mendel在20世纪80年代采用递归神经网络（NN）进行地震反褶积，至此，人们对AI的兴趣又重新兴起。ML从知识驱动转变为数据驱动发生在20世纪90年代，当时发表了地球物理中关于NN的首篇综述。McCormack的综述探索了模式识别，并总结了过去30年来NN的应用，以及地震道编辑和自动测井分析的应用样本。深度学习（DL）和卷积神经网络（CNN）在21世纪10年代得到复兴，当时Waldeland和Solberg将小型CNN应用于地震数据以进行盐识别。断层解释、层位选取和岩相分类是CNN在地球科学中的其他应用。Mosser等应用了生成式对抗网络（GAN），即ML模型，其中两个NN竞争性地协同工作，以在地球科学早期进行更准确的预测，从而对三维（3D）多孔介质进行孔隙尺度建模。GAN还用于地震记录生成和地质统计反演。

地震活动是地球科学中的另一个重要领域，ML在其中得到了广泛应用。Mousavi等使用ML算法，根据地面接收器上记录的波形特征，区分深部微地震事件和浅部微地震事件。He等使用ML算法来改进诱发地震事件的风险管理。他们提出的模型是一组简单的闭式表达式，具有透明度高、执行速度快的优点，为操作员提供了最大的成功可能性。采矿、油气田枯竭、废水注入和地热作业等工业活动会诱发地震。在加拿大西部，水力压裂（HF）引发的地震活动受到了公众和学术界的关注。由于强烈耦合的地质力学、地球物理和地质行为带来的复杂性，研究诱发地震活动与HF之间的相关性一直是一项极具挑战性的工作。因此，ML在地震活动中的应用仍存在很大的探索空间。

（二）智能油藏工程

ML算法常用于油藏工程的各个领域，特别是在油藏表征和压力、体积和温度（PVT）计算方面。Gharbi和Elsharkawy开发了一个双层NN，用于估计油层的泡点压力和地层体积系数。在另一项研究中，采用径向基函数和多层感知器NN来估计地层体积系数、等温压缩性和盐水含盐量。Wang等在组成油藏模拟中使用人工神经网络（ANN）进行相平衡计算，包括相稳定性测试和相分裂计算。将两种方法，即支持向量机（SVM）和模糊逻辑相结合，使用实际测井作为输入，预测渗透率和孔隙度。Patel和Chatterjee利用分类算法进行快速准确的岩石分类（即根据相似性将储油岩分为不同类别）。在随机噪声存在的情况下，探索了具有单个隐藏层的ANN的性能，以建立预测低速层厚度的模型。该方法还被用于加拿大阿尔伯塔省北部的一个油田，以构建孔隙度净产层厚度分布图。据该分布图，钻了四口井，油田产量增加了近20%。Jamialahmadi和Javadpour利用径向基函数NN，使用深度测量和岩心数据的孔隙度作为输入，估算伊拉克共和国南部整个油田的渗透率。Wang等开发了一个集成ML模型（即随机森林算法），以使用结构复杂且高度断裂的海上油田的实际生产和注入数据作为主要输入，预测井位的延时饱和度剖面。通过引入极限学习机（ELM），开发了一个用于预测多个储层参数（即孔隙度、饱和度、岩相和页岩含量）的新框架，这是最先进的ML技术之一。与典型的单层前馈NN方法相比，该方法在不牺牲精度的情况下，需要的计算资源和训练时间更少。

（三）智能生产工程

生产预测/优化和HF是能源行业中ML日益流行的另外两个领域。生产预测和优化必须考虑许多参数，包括采油工艺、支撑剂类型、井距、处理速度和压裂阶段数。尽管操作参数优化可以节省数百万美元，并显著提高非常规油藏产量，但传统的油藏模拟计算成本高昂，在考虑油藏特征的不同变化的情况下，计算成本会增加。因此，产量预测和优化是AI应用的良好候选领域，如最近开发和分析的用于各种开采工艺（如水和化学剂驱油以及蒸汽注入）的ML算法所示。Dang等利用NN对相对渗透率进行多维插值，以克服混合开采过程中不同参数（即聚合物、表面活性剂和盐度）的影响。使用地质、岩心和测井数据对不同储层中的井进行产量预测，是ML算法广泛用于该领域的应用。Tadjer等利用DeepAR和Prophet（时间序列ML算法）作为短期油气井预测递减曲线分析的替代方案。使用NN预测垂直井的井底压力（生产设施设计的关键参数）是ML在该领域的另一个应用。运用长短期记忆（LSTM）模型和特征选择方法预测加拿大Duvernay页岩气井的日产量。Popa和Connel通过将模糊逻辑和NN相结合进行地层性能评估，研究了水平井位优化。

在过去20年中，HF工作的数量不断增加，产生了大量可用于构建ML预测模型的测量数据。进行了一项使用模糊逻辑聚类分析绘制Utica页岩天然裂缝网络的研究。He等利用AI和模糊逻辑分析，开发了一种优化页岩气储层HF设计的模型。使用SVM开发了一种用于确定粗糙岩石水力开度的新模型。Yang等建立了一种数据分析方法，该方法将由声波测井得出的设计参数与压裂后分析得出的设计参数相结合，用于优化压裂处理设计。通过使用生产测井仪数据和沿Marcellus页岩储层水平井的深剪切波成像，验证了所获得的压裂优化算法。Wang和Sun提出了一种将ML、储层模拟和HF相结合的综合方法，用于优化二叠纪页岩中的井距，并考虑了该大区域每个代表性区域的典型井。Bangi和Kwon应用强化学习算法达到了沿裂隙的均匀支撑剂浓度，从而提高HF生产率；研究人员将降维与迁移学习相结合，以加快学习过程。Duplyakov等提出了一种基于升压算法和岭回归组合的模型，用于预测多级压裂完井的累积产油量。对加拿大阿尔伯塔省Montney地层的74口HF井进行了案例研究，以井间距、岩石力学特性和完井参数作为输入特征，预测5年内的累积产量剖面。利用基于产量、完井和HF数据的深度NN作为输入特征，开发了一个用于预测页岩储层累积天然气产量的代理模型；使用Montney地层中1239口水平井的现场数据验证了该模型。

（四）智能钻探工程

考虑钻井作业期间每天都会产生大量的实时数据，钻井工程也从ML的应用中受益匪浅。由于近年来油价不稳定，人们一直在寻求如何在各种价格方案中确保良好的经济性。为了实现这一目标，ML已经变得越来越普遍，以及时缓解钻井挑战。钻井作业优化和卡钻预测是钻井工程中最关键的两个领域，人们经常使用AI进行研究。Mohaghgh利用ANN及时识别钻井异常及其相关非生产时间（NPT）。Unrau等开发了ML模型，用来确定实时报警阈值，以便在钻井作业期间检测流速和泥浆体积数据的异常。该模型有助于早期检测井漏，并最大程度地减少错误报警。Pollock等应用强化学习算法，基于二叠纪和阿巴拉契亚盆地的14口水平井，改进预训练NN。改进后的模型将曲折度和计划轨迹偏差降至最低，误差小于3%。Zhao等应用ML算法得出不同钻井参数的趋势，用于识别异常事件并提出相应的补救措施。已尝试使用钻压、流速和每分钟转数等钻井特征，将ML算法应用于优化钻速（ROP）。Goebel等通过对钻速、管道旋转、倾斜角度和流速等各种参数进行监测和研究，开发了一种ML模型来预测未来的卡钻管柱。一年后，Dursun等提出了钻井期间的实时风险预测。将ML算法与数据挖掘和自然语言处理（NLP）技术相结合，在极短的时间内调查中东地区两个陆上油田的每日钻井报告（DDR），以便对生产和NPT进行分类，并发现NPT的关键影响因素。

二、挑战和机遇

ML算法可以非常有效地用来解决三种主要类型的问题：为已了解的问题构建替代模型，以降低计算成本；为需要人为干预和知识分析的问题建立ML模型；为以前无法解决的复杂问题建立ML模型。在环境简单、数据容易获取且决策成本不昂贵的领域，ML能够最快地取得成功。尽管石油工业中使用ML的大多数情况不符合这几类问题中的任何一个，但通过有效运用ML投资长期收益可以提供大量价值，不过需要周密的设计，并与领域专家高度合作。

将ML算法应用于石油工程问题需要克服各种挑战。一项挑战是，数据量往往很大（即大量数据），数据种类（即许多不同的数据格式）和真实性（即数据不一致、不准确）繁多，且速度快（即数据流入率高）。石油工业操作设备上安装的井下和地面传感器每天都会产生大量的数据。该行业利用结构化和非结构化数据来跟踪生产、安全和维护。获取石油行业的准确数据通常很困难或不可能，而且可能很昂贵。因此，获取足够数量的高质量数据用于培训和验证ML模型是石油行业面临的普遍挑战，这会导致训练数据出现不确定性和噪声。反过来，这些问题会损害ML模型的通用性和准确性。此外，原始数据通常不适合ML算法，需要进行预处理和清洗。地下不确定性和数据处理时间延误也是重要的考虑因素。此外，此类数据通常存在于各部门的小数据库中，由于保密问题和竞争优势，相应的模型要么没有，要么不向其他人开放。这一问题在学术环境中尤为普遍。此外，模型的可解释性对地球科学很重要，因为知道导致结果的原因与知道结果本身同样重要。

或许由于上述挑战，ML在地球科学领域的应用并没有像在许多其他领域那样得到迅速发展。尽管ML是一种很有前途的技术，可以利用大数据发现输入-输出关系并得出信息，但ML的性能可能会因数据的高维性而受到影响。这可能导致误导性的相关性以及不切实际和不可靠的聚类。值得注意的是，数据在其初始状态下通常是模棱两可的，因此，需要不同的预处理技术来识别显著特征并使ML模型能够学习系统的行为。存在一个风险，即缺少数据和缺乏系统稳定性可能会将偏差引入ML模型中，使模型难以从数据中提取有益知识。此外，应考虑利用不同来源数据的问题和挑战。与数据相关的隐私、安全和道德也是需要考虑的非常重要的方面。混合建模集成了ML算法与基于物理的方法，可以被认为是缓解上述问题的一种方法。此外，迁移学习是一种相对较新的ML技术，在地球科学领域具有良好前景。其中使用预训练模型作为起点，然后通过考虑自己的训练数据在预训练模型上进行模型训练。

三、展望

ML的潜力在石油工业油藏模拟和文本挖掘这两个领域尚未得到充分利用。油藏模拟涉及可充分说明物理性质随时间和空间而变化的微分方程（DE），因此有助于描述自然界中的物理现象。科学和工程中有许多问题，需要解决复杂的DE。然而，DE非常难解决，其相关模拟极其复杂且计算量大。这种复杂程度要求使用巨型计算机进行模拟，并也说明这一领域研究人员对AI的兴趣是合理的。DL包含具有多个隐藏层的NN，利用DL是一种很有前途的技术，可以加快DE的求解速度，节省科学家和工程师大量的时间和精力。加利福尼亚理工学院（Caltech）的研究人员引入了一种新的DL技术来求解DE，该技术比传统DL算法更准确、更通用，并且速度快1000倍。这种新方法基于在傅里叶空间而不是传统DL中的欧几里得空间中定义输入和输出。这一进步不仅减少了对超级计算机的依赖，还将提高计算能力，以有效地模拟更复杂的问题。

石油行业刚刚开始利用ML的技术进行智能报告并从文本中提取信息。每日钻井和完井报告是行业中两种主要的文本文件，这些文件包含重要文本以及各种其他类型的数据，如深度、套管尺寸、井眼尺寸和射孔深度。NLP和DL算法可用来开发用于作业自动化质量控制和性能改进的模型，可提供更有效率的方法，远超依赖专家专业知识的传统方法。一些研究调查了石油行业中的文本处理，重点关注了风险管理和问题预测用运算数据的文本挖掘、基于报告的上下文分析的生产指标和模式识别，以及报告分类等主题。尽管文献中包含了使用文本挖掘技术缓解行业中基于文本的挑战等研究，但ML在这一领域仍有巨大潜力，必须对ML进行进一步探索。

四、结论

数据驱动的方法和AI算法有足够的前景，有朝一日它们可能比基于物理的方法更可靠。它们的主要来源是数据，这是每个场景的基本要素。这些算法可学习数据并揭示看不见的模式。在石油行业内，人们对利用这项技术从每秒生成的大量数据中获取信息非常感兴趣。许多研究探索了AI在该行业各个分支学科的适用性；然而，明显缺乏两个主要特征。也就是说，关于这一主题的大多数研究要么不够实用，不适用于实际领域的挑战，要么仅限于特定问题，不可推广。必须注意数据本身以及数据的分类和存储方式。尽管有大量的由不同学科产生的数据，但它们仍然存在于部门的小数据库中，其他人员无法访问。为了从数据中获取尽可能多的信息，数据必须存储在一个集中的数据库中，不同的应用程序可以从中方便地使用数据。在数据采集后以及在运用AI和ML技术之前，必须对数据进行处理，以便有效地提取特征并确保数据能够有效地支持算法。尽管AI和ML技术在石油和油藏工程领域越来越重要，但它们只是整体系统的一部分。为了确保该系统能够提供价值，将算法应用于这一具有挑战性的领域还需要仔细考虑，并且必须提供正确类型、质量和数量的数据，然后对数据进行有效处理，以取得预期结果。因此，尽管AI是有效管理世界地下资源的关键工具，但数据是充分利用这些可能性的关键。

注：本文内容呈现略有调整，若需可查看原文。

改编原文：

Mohammad Ali Mirza, Mahtab Ghoroori, Zhangxin Chen. Intelligent Petroleum Engineering[J]. Engineering,2022,18(11):27-32.

注：论文反映的是研究成果进展，不代表《中国工程科学》杂志社的观点。

展开阅读全文

页面更新：2024-05-18

标签：石油油藏工程地球科学算法模型领域智能方法数据技术

1 2 3 4 5

智能石油工程丨Engineering

香港同城最快4小时达：京东港澳多个自营中心齐开，快递巨头加速角逐

中文在线集团董事、常务副总裁谢广才：IP生态化打造，对消费的带动作用是现象级的

华为手机市场占有率逆势上攻或推动国内智能手机大调整

6年发射32颗卫星，3300亿挖运河？骗走国家280亿，现已失联

热搜爆了！华为官宣，谢霆锋亮相

西湖大学“柠檬酸教授”杨健获美国生物医学工程学会奖项

DNF：氪不改命，玄不救非，当年为了出货无所不用的手段

《虚妄轮回》：单机卡牌游戏向RPG游戏的一次大靠拢

Volition关门后黑道圣徒红色派系IP将继续存在

梦幻西游：为平民五开定制的技巧，阵容配置轻松达到最优化

传言称R星或将于年底之前正式公布《GTA6》情报

皮肤销量排行榜9.2：免费依旧卖爆了，缤纷独角兽销量打破纪录

DNF：要提前留意了！仙界版本更新后，部分自定义词条改版变强

WLK怀旧服：P4死亡裁决等TOC饰品免费送！还有另一个好消息

S31赛季最好上分的五大野王，巅峰排位能通吃，带飞队友很轻松！

华为手机市场占有率逆势上攻或推动国内智能手机大调

西湖大学“柠檬酸教授”杨健获美国生物医学工程学会奖

瓦尔德内尔：中国女乒史上，论单打，技术能达到世界顶尖的仅

一等奖！吉大这项技术发明应用于我国600多家单位，并出口

成果快讯 - 突破性进展！勘探技术所井底动力硬岩取心钻

文心大模型4.0发布，李彦宏：相比GPT-4毫不逊色

中医按摩预防亚健康，越秀面向市民开班培训慢性筋骨病诊

“绿色”筑梦看见未来-2023长沙国际绿色智能建造与建

面向产业端！商汤“上新”医疗大语言模型“大医” 已在

超越人类智能：自我进化的深度学习系统