分享自:

基于多源数据融合的单井产量预测

期刊:expert systems with applicationsDOI:10.1016/j.eswa.2024.123955

本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


多源数据融合的单井产量预测方法研究

作者及机构
本研究的通讯作者为Fan Min(西南石油大学计算机科学与软件工程学院),合作者包括Chao Min、Yijia Wang(西南石油大学人工智能研究院)、Huohai Yang(油气藏地质及开发工程国家重点实验室)和Wei Zhao(胜利油田勘探开发研究院)。研究发表于2024年的期刊*Expert Systems with Applications*(卷250,文章编号123955)。

学术背景
研究领域为石油工程中的产量预测,核心科学问题是如何克服传统单井产量预测方法对不确定因素的敏感性。现有方法主要依赖生产历史趋势线或整体开发过程数据,但忽略了多源数据(静态地质信息、动态生产历史、邻井注水空间信息)之间的关联性。研究目标是通过构建新型堆叠模型(stacking model),融合三类数据,提升预测精度和泛化能力。

研究流程
1. 数据预处理与分类
- 数据分类:将影响因素分为三类(表1):
- 静态地质信息(如原始地层压力、地质储量、有效厚度);
- 动态生产历史(如泵效、动液面、累计产油量);
- 空间信息(目标井与相邻注水井的坐标及月度注水量)。
- 数据清洗:通过箱线图(boxplot)识别异常值,静态数据用K近邻(KNN)填充缺失值,动态序列用插值法处理。
- 特征选择:结合相关性分析和石油工程知识,筛选13个关键特征(表2),如转换中心深度、泵效、冲程频率等。

  1. 空间信息融合

    • 通过欧氏距离确定目标油井相邻的注水井,计算月度产油量与注水量的交叉相关系数(公式1-3),筛选相关性最高的注水井数据(阈值|r|≥0.3,滞后阶数θ<12个月)。
    • 对无显著相关性的井,注入平均注水序列作为背景噪声(图2)。
  2. 堆叠模型构建

    • 模型结构(图4):
      • 静态编码模块:多层感知机(MLP, multilayer perceptron),处理静态地质特征向量;
      • 动态编码模块:长短期记忆网络(LSTM, long short-term memory),提取生产历史时序特征;
      • 空间编码模块:另一LSTM网络,处理注水井响应的时空延迟效应。
    • 融合层:全连接层耦合三类特征,输出月度产油量预测(公式5-8)。
    • 理论验证:通过符号传递熵(STE, symbolic transfer entropy)证明动态与静态数据融合的因果性增强效应(图5)。
  3. 实验验证

    • 数据集:中国某水驱油田区块的30口油井数据(2520个样本)。
    • 基线模型对比:包括随机森林(RF)、BP神经网络、CNN、GRU、LSTM及串联模型(如S-CNN-LSTM)。
    • 评价指标:R²分数、均方根误差(RMSE)、平均绝对误差(MAE)。
    • 结果
      • 堆叠模型的R²分数达0.8316(Well 1)和0.9388(Well 2),显著优于静态和单一动态模型(表6);
      • 融合注水信息后,部分井预测精度提升(如Well 1的R²从0.828升至0.912),但相关性低的井可能效果下降(Well 2的R²从0.804降至0.750)(表7);
      • 输入序列长度影响显著,60个月数据的预测效果优于30个月和12个月(表8)。

主要结果与逻辑关联
- 数据融合有效性:STE分析显示,动态与静态数据联合输入的熵值高于单一数据,验证了堆叠结构的合理性(图5)。
- 模型优势:堆叠模型通过分模块处理多源数据,避免了传统方法中静态特征掩盖动态趋势的问题(图9-10)。
- 预警应用:模型成功识别出某井第49个月的产量异常(偏差17.6吨),与实际穿孔作业时间吻合(图15)。

结论与价值
1. 科学价值:提出了一种基于因果发现的多源数据融合框架,为复杂油藏的单井产量预测提供了新范式。
2. 应用价值:模型可实时预警产量突变,指导油田开发方案调整。
3. 局限性:模型需针对不同区块重新训练,但方法论具有普适性。

研究亮点
- 方法创新:首次将STE用于验证石油产量预测模型的信息融合质量;
- 工程结合:模型结构设计融合了动态分析经验,如注水响应滞后机制;
- 多学科交叉:结合石油工程、信息论与深度学习,提升了预测的可解释性。

其他有价值内容
- 特征重要性分析显示,动液面、生产天数和冲程对模型影响最大(图14);
- 开源了数据预处理代码(未在文中明确提及,但方法部分可复现)。


该研究通过创新的堆叠模型和严谨的因果验证,为石油行业提供了高精度的单井产量预测工具,同时为多源时序数据融合领域提供了参考案例。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com