分享自:

基于长短期记忆神经网络的边坡多步开挖位移预测替代模型:针对小样本数据和多特征多任务学习

期刊:georisk: assessment and management of risk for engineered systems and geohazardsDOI:10.1080/17499518.2024.2356543

基于长短期记忆神经网络的边坡多步开挖位移预测替代模型研究

作者及发表信息

本研究由Yue DaiWujiao Dai(中南大学地球科学与信息物理学院)和Jiawei Xie(澳大利亚纽卡斯尔大学土木、测量与环境工程学院)合作完成,发表于Georisk: Assessment and Management of Risk for Engineered Systems and Geohazards期刊2025年第19卷第1期,页码158-177,DOI: 10.108017499518.2024.2356543。

学术背景

研究领域:本研究属于岩土工程与机器学习交叉领域,聚焦边坡开挖位移预测的替代模型(surrogate model)开发。

研究动机
1. 工程需求:边坡坍塌事故频发,传统数值模拟(如FLAC3D)计算成本高,尤其在反分析、优化设计和可靠性分析中需反复模拟,效率低下。
2. 技术瓶颈:现有机器学习模型在小样本、多特征(multi-feature)和多任务(multi-task)场景下的性能尚未系统评估,且缺乏针对动态开挖过程的时序建模方法。
3. 目标:提出一种基于长短期记忆神经网络(LSTM, Long Short-Term Memory)的替代模型,解决小样本数据学习、多特征输入和多任务输出的挑战。

研究流程与方法

1. 数据集生成与实验设计

研究对象
- 2D边坡开挖案例:通过FLAC3D构建数值模型,包含7120个网格单元和11,070个节点,采用Mohr-Coulomb本构模型。
- 3D实际工程案例:某水电站开挖边坡,模型包含206,910个单元和363,900个节点,验证模型鲁棒性。

数据生成方法
- 拉丁超立方采样(LHS, Latin Hypercube Sampling):生成100组样本,输入特征包括岩土力学参数(弹性模量、黏聚力)和开挖特征(体积、长度、深度、坡度)。
- 敏感性分析:筛选对位移响应显著影响的参数(弹性模量、黏聚力),缩小采样范围以提高效率。

实验设计
- 小样本学习评估:按训练集-测试集比例(80-20%、60-40%、40-60%)划分数据,对比LSTM与SVR(支持向量回归)、RF(随机森林)、XGBoost、BPNN(反向传播神经网络)、GPR(高斯过程回归)的性能。
- 多特征学习评估:引入开挖特征作为输入,构建统一的多步开挖模型。
- 多任务学习评估:同时预测监测点的水平和竖向位移,对比LSTM与多输出GPR(MOGPR)的表现。

2. 模型开发与优化

LSTM模型架构
- 门控机制:输入门、遗忘门、输出门控制信息流动,解决梯度消失问题(公式1-2)。
- 参数优化:采用粒子群算法(PSO, Particle Swarm Optimization)自动调参,提升模型精度。

对比模型
- 传统模型:SVR(核函数优化)、RF、XGBoost、BPNN。
- 概率模型:GPR通过贝叶斯框架建模不确定性,适合小样本场景。

3. 评估指标

  • R平方(R²)均方根误差(RMSE):量化模型预测精度(公式5-6)。
  • 计算效率:记录数值模拟与替代模型的耗时对比。

主要结果

1. 小样本学习性能

  • LSTM与GPR表现最佳:在训练样本少于50时,R²仍超过0.99,RMSE低于0.07 mm。
  • SVR稳定性强:样本减少时精度下降幅度最小,但整体略逊于LSTM。
  • RF与XGBoost劣势:样本量降低时精度显著下降(RF的R²最低至0.85)。

2. 多特征学习影响

  • SVR性能下降32.5%:引入开挖特征后过拟合风险增加。
  • LSTM与GPR提升显著:精度分别提高66.3%和88.0%,表明其能有效融合多特征信息。

3. 多任务学习对比

  • LSTM全面优于MOGPR
    • 水平位移预测中,MOGPR的RMSE升至0.13 mm(单任务时为0.02 mm)。
    • LSTM通过共享参数实现多任务协同学习,R²稳定在0.99以上。

4. 3D案例验证

  • LSTM鲁棒性验证:在50组训练样本下,对8个监测站的位移预测R²均超过0.99,RMSE控制在0.09–0.61 mm。

结论与价值

科学价值
1. 证明了LSTM在小样本、多特征和多任务场景下的优越性,为岩土工程动态过程建模提供了新范式。
2. 揭示了开挖特征作为模型输入的可行性,推动了多步开挖统一建模的发展。

应用价值
1. 高效替代数值模拟:替代模型预测耗时不足0.1秒,比FLAC3D快100倍以上,适用于大规模反分析。
2. 工程决策支持:帮助工程师快速选择合适模型,例如小样本优先选用GPR,多任务场景首选LSTM。

研究亮点

  1. 创新模型:首次将LSTM应用于边坡动态开挖位移预测,解决了时序依赖性和多特征融合问题。
  2. 系统对比:全面评估六类主流模型在不同学习场景下的性能,填补了岩土工程替代模型选择的空白。
  3. 实际验证:通过复杂3D案例证实了模型的工程适用性,为类似场景(如隧道开挖)提供了参考。

其他价值

  • 开源工具推荐:提及GPflow等MOGPR工具,促进多任务学习技术的应用。
  • 未来方向:建议拓展至隧道工程反分析及数据驱动的边坡稳定性自动评估。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com