2024年6月,筆者到訪之江實驗室并與國家最高科技獎獲得者、中國科學院院士李德仁進行互動交流。在對談中,李院士不經意地問:“你們油氣行業的科研事情是假設驅動照舊數據驅動?”筆者略加思索后回覆:“油氣行業,尤其是上游的勘探開發研究,目前照舊以假設驅動為主,也就是先構建一個地質模型,再以此為指導開展迭代研究。”李院士頷首認同。半年多來,筆者一直在深入思考李院士提出的上述問題,并進一步結合近年來洶涌澎湃人工智能生長浪潮,探尋現代信息科技尤其是人工智能給油氣資源開發領域帶來哪些厘革。
一些學者認為,人工智能(AI)是第四次工業革命的標記和引擎,但回首工業革命演變史,筆者認為人工智能也許是新時代的“人類進步加速器”,將成為增進人類生長新的革命性力量,深刻地改變人類生爆發活方法且成為新的時代標記,并引領人類從工業革命時代逐步進入人工智能時代。油氣行業生長必須與人工智能時代相適應,盡快從假設驅動為主邁向數據驅動為主。
各有千秋 相輔相成
古板認識中,假設驅動(Hypothesis-Driven)和數據驅動(Data-Driven)作為兩種差別的要領論,適用于差別的情境且各有優缺點。
假設驅動是基于現有知識,依賴理論、經驗甚至直覺提失事物如何運作的假設,再通過視察、實驗、視察或其他形式的數據來驗證這些初始假設,好比通過露頭視察、薄片掃描、巖心剖析、地球物理探測等直接獲取的地質信息來驗證預先構建的地質模型,實質上是一種以“試錯法”不絕校正迫近真相的歷程。其優點在于有明確的偏向和目標,可以快速聚焦于特定的問題或解決計劃;缺點是最初的主觀性假設可能禁絕確,導致后續驗證事情泛起主觀設計上的偏差!坝蜌庠诘刭|學家的腦海里”,即是油氣行業假設驅動的典范理念。
數據驅動強挪用數據說話、讓數據作主,通過盡可能多收集相關數據,使用統計剖析、概率盤算等數據剖析要領來挖掘數據中的模式、趨勢和關聯,實質上是一種基于數據的“設計法”尋求最優解的歷程。其優點在于可以越發客觀地揭示之前未被注意到的洞見;缺點是數據代表性與質量問題、太過擬合以及對大宗數據處理能力的需求。但隨著人工智能時代的到來,機械學習、數字孿生、量子盤算等技術組合應用給數據驅動要領論帶來了強大的內核升級,必將突破擁有海量數據的油氣行業固有生長路徑和邏輯。
假設驅動與數據驅動歷來不是非此即彼的對立選擇,而是相輔相成、不可割裂的兩種思維方法。就像人類和AI的關系,遠非簡單的取代與被取代所能概括,實際上是一個相互學習、配合提升的歷程。在假設驅動的創立性思維方面,AI目前還難以與人類相提并論,它對特定問題的優化與求解,還不是真正意義上的理解與創立。相比之下,數據驅動的AI因其強大剖析能力不絕地拓寬人類的認知界限,但人類的泛化能力和立異思維仍然尤為名貴。
石油勘探開發是典范的綜合性應用學科,樂成找到油氣并商業開發是一項龐大的探索發明歷程,需要地質勘查、地球物理探測、鉆井、儲層革新、油氣開采等多種技術手段、大宗數據積累以及不絕優化的預測模型支撐。
假設驅動 認知先行
早期油氣發明主要依賴直覺和經驗驅動,出露地表形成的油氣苗是尋找地下油氣的主要依據。
美國賓夕法尼亞州泰特斯維爾城四周的一條小河因經常漂著原油,被外地居民稱為“石油溪”。1859年,埃德溫·德雷克在石油溪旁鉆成了世界第一口商業性油井——德雷克井,成為現代石油工業起源地。
中國早期油氣勘探開發運動也多圍繞油氣苗展開,如新疆“黑油山”四周發明克拉瑪依油田,甘肅“石油溝”旁邊發明玉門油田,青海“油砂山”四周發明油砂山油田。
地質理論假設驅動大油氣田發明。19世紀中葉,地質學家們發明美國賓夕法尼亞地區油氣均位于砂巖層的最高部位,推動背斜找油等相關理論形成,為后續全球大規模油氣發明滌訕基礎。之后,加拿大石油地質學家T.S.亨特、蘇聯地球化學家B.A.別納科依、美國地質學家W.E.普賴特等基于數據剖析和油氣勘探開發實踐,生長了海相生油理論,引領中東等地海相油氣大發明。
中國地質學家謝家榮、李四光等人基于對中國地質特征的認知和推斷,提出了陸相生油理論,突破了外洋古板看法束縛,推動大慶、勝利油田發明,成為假設驅動尋找油氣資源的典范范式。
最近,我國石油科技事情者提出的煤巖氣地質理論已獲得樂成的實踐驗證,亦是假設驅動尋找新類型油氣資源的例證。
數據驅動 快速迭代
目今油氣發明仍主要依賴于人腦智慧和實驗驗證,通過假設驅動提出科學問題,利用數據驅動進行輔助驗證。但隨著油氣賦存方法的龐大化,古板經驗已經難以支撐油氣發明,特別是非通例油氣逐漸成為勘探開發主體確當下。盡管人工智能技術還保存一定的局限性,還不可完全解釋數據背后的地質紀律和滲流機理,很難對龐大地質條件做出客觀準確的判斷,但科學家們已意識到數據資產的重要性和數據技術的厘革性。
2024年6月,之江實驗室開發的GeoGPT地學大語言模型通過備案,已實現文獻閱讀、信息提取、地質圖解譯與生成、知識圖譜構建等功效,成為人工智能助推地球科學研究模式厘革的標記性事件,它的強大功效使我們對智慧油氣藏的遐想成為可能。2024年11月,中國石油宣布了700億參數昆侖大模型,還帶來了43個石油行業的專業應用和通用應用立異場景。油氣勘探領域,海內首次構建了涵蓋地動處理、地動解釋、測井處理解釋3個專業模型,相比古板要領,在泛化性、精度等方面都有了大幅提升。
人的壽命和知識掌握能力是有限的,相比之下,人工智能在影象能力、高維龐大、推理深度等方面具有強大而奇特的優勢,可以快速修正并迭代完善假設驅動形成的經驗模型,極大地提升人類科學發明效率。
不久的將來,如果人工智能油氣大模型能夠擁有全球油氣勘探開發的歷史和實時數據,并實現從推斷(inference)到推理(reasoning)的躍升,就具備了科學假想的潛力,從而突破科學家的認知界限,實現真正的行業推翻。
關于需要和“歷史億萬年、地下上萬米”打交道的油氣行業來說,全生命周期將是涉及海量流程節點的龐大系統工程,以人工智能為技術手段的數據驅動要領將在各個環節中飾演越來越重要的角色,引發的數智化厘革將深刻改變油氣行業的工業運營模式、科研攻關方法、生產治理范式、勘探開發效率等方方面面。
行業重塑 擁抱未來
筆者在油氣行業已事情30余年,見證了該行業的榮光,也一直在思考和探索數據驅動是否將成為石油行業生長的焦點驅動力。
近年來,基于系統科學思想與要領,提出的非通例油氣規模效益開發“一全六化”工程要領論,其中最為要害的一環就是以數據驅動為引領的數智化治理,主要以大數據系統、數字化管控、智能化決策為基礎,打造全面感知、自動生產、實時優化、預測預警、協同研究、一體運行的生產運營新模式,將成倍甚至成數量級地提高油氣田生產作業效率。除此之外,推行數據驅動理念,組織科研力量實驗探索新的資源類型、破解新的技術瓶頸,例如,用“AI+生物學”發明一種終極采油法,實現極限提高油氣采收率;用“AI+化學反應動力學”探索氫氣、氦氣、二氧化碳與巖石礦物間原位物理化學歷程,打造地下能源存儲及反應工廠。
“未來像盛夏的大雨,在我們還來缺乏撐開傘時便撲面而來”。2022年底,ChatGPT就像是一場突如其來的盛夏大雨,以前所未有的速度席卷全球,開啟了人工智能的新紀元。2024年,諾貝爾物理學獎和化學獎都頒給了從事人工智能的研究學者。近期,DeepSeek在全球掀起的熱議浪潮,再次刷新人類對人工智能的認知,更預示著一場前所未有的人工智能科技革命甚至是時代厘革的加速演進。
一言以蔽之,AI賦能科學探索的新范式已彰顯出巨大的優勢,也必將在油氣新資源發明、采收率極限提高以及與新能源融合生長等方面展現出前所未見的潛力。
2024年,中國石油已將“數智石油”列為第五大戰略舉措。毫無疑問,AI將重塑油氣行業,以數據驅動為主、假設驅動為輔的新模式將會推動油氣行業朝著越發高效、更為智能、更可連續的偏向快速前進。作為石油科技事情者,我們要以越發積極的姿態不絕識變、應變、求變,主動擁抱“AI+油氣”時代的到來。
(作者李國欣為中國石油天然氣股份有限公司副總地質師兼中國石油勘探開發研究院黨委書記,獲得國家科技進步獎一等獎、“孫越崎能源大獎”等獎項)
文章來源:國家能源局