基于分层控制架构的土压平衡盾构机自主协同优化控制研究
一、研究团队与发表信息
本研究由辽宁石油化工大学信息与控制工程学院的Xuanyu Liu、Wenshuai Zhang(共同一作)团队联合大连理工大学先进控制技术研究所Cheng Shao及中庆建设有限责任公司Yudong Wang等合作完成,发表于2024年9月的《Engineering Applications of Artificial Intelligence》期刊(Volume 137, 109200)。
二、学术背景与研究目标
科学领域:本研究属于地下工程智能控制与人工智能交叉领域,聚焦盾构机(shield machine)的土压平衡(earth pressure balance, EPB)自主控制问题。
研究背景:传统盾构机依赖人工经验调节密封舱压力(sealed cabin pressure),但地质条件动态变化时响应效率低下,易引发安全事故。现有基于机理模型或单一智能算法(如LSTM、DDPG)的控制方法存在精度不足、泛化性差、策略波动等问题。
研究目标:提出一种结合数字孪生(cyber-physical system, CPS)与分层控制的TD3-MPC(Twin Double Deep Deterministic Policy Gradient-Model Predictive Control)自主控制方案,实现密封舱压力的实时动态优化与精准跟踪。
三、研究流程与方法
1. 动态建模阶段
- 研究对象:盾构机密封舱压力系统的输入(螺旋输送机转速n₀、推进速度v)与输出(密封舱压力p)。
- 方法:
- 动力学模型:基于活塞假设推导开挖面土体受力方程(式3),引入阻力系数ω、开挖面压力p₁等参数。
- 机理模型:通过土体进出体积平衡方程(式7)构建密封舱压力与机械参数的数学关系,含泄漏系数cₑₚ、压缩因子βₑ等。
- 状态空间模型:整合上述模型,建立以p和vₚ为状态变量的线性时不变系统(式11),用于后续MPC设计。
2. 分层控制方案设计
(1)协调层(TD3智能体)
- 虚拟环境构建:基于密封舱压力机理模型模拟实际地质条件,输入地质参数(黏聚力c、土体有效重力γ、内摩擦角φ等)。
- TD3算法改进:
- 网络结构:Actor网络(图6)输入状态(pₜ、目标压力p、偏差pₑ),输出v和n₀;Critic网络(图7)通过双Q网络与延迟更新解决过估计问题。
- 奖励函数:以压力偏差平方的负值(式12)驱动智能体逼近目标压力。
- 超参数优化:通过测试7组学习率组合(图8),确定Critic网络0.00001、Actor网络0.001的最佳配置。
- 验证:使用北京地铁10号线实际数据验证虚拟环境误差<0.007 MPa(图9)。
(2)执行层(MPC控制器)
- 模型预测:基于状态空间模型离散化(式14),设计二次规划目标函数(式18),纳入控制量约束(式15-17)。
- 滚动优化:通过实时反馈压力值,动态调整v和n₀(图10),实现最优压力曲线跟踪。
四、主要研究结果
1. TD3智能体性能验证
- 对比实验:与PPO、DDPG、LSTM相比,TD3智能体在黏土地质下压力控制误差最终稳定为0 MPa(图12),且策略成本更低(螺旋输送机转速10.14 rpm vs. DDPG的5.45 rpm,表3)。
2. 分层控制策略合理性
- 与实际工况对比:TD3-MPC输出的v(34.9 mm/min)和n₀(10.14 rpm)与专家经验值误差%,压力控制效果优于人工调节(图16)。
3. 地质适应性验证
- 土层转换任务:从黏土到全风化岩(目标压力0.15→0.3 MPa),系统在20-30秒内完成调整(图17),策略稳定性显著优于DDPG端到端控制(图20)。
- 九类地质测试:系统对小(Δp≤0.05 MPa)、中(0.05<Δp≤0.1 MPa)、大差异(0.1<Δp≤0.15 MPa)土层均能快速适应(图19)。
五、结论与价值
科学价值:
1. 首次提出TD3-MPC分层架构,解决了单一智能算法在复杂地质下的策略波动问题。
2. 通过CPS框架实现了盾构机信息物理深度融合,为地下工程AI应用提供新范式。
应用价值:
- 安全性:密封舱压力控制误差接近0,降低地表变形风险。
- 经济性:较人工调节提升施工效率,减少能耗与维护成本。
创新点:
1. 协调层-执行层协同优化设计,兼顾决策智能性与控制稳定性。
2. 动态状态空间模型结合TD3强化学习,增强地质自适应能力。
挑战与展望:需优化子系统通信实时性、扩展多参数多智能体控制,未来可构建更精确的”黑箱”地质环境模型。
(注:本文专业术语如”密封舱压力(sealed cabin pressure)”、”土压平衡(EPB)”等首次出现时均标注英文原词。)