大型土方工程运输动态调度的多任务深度强化学习研究
作者及机构
本研究由天津大学水利工程智能建造与运维国家重点实验室的Yunuo Zhang、Jun Zhang*、Xiaoling Wang*和Tuocheng Zeng共同完成,发表于2025年3月的期刊《Automation in Construction》(Volume 174, 106123)。
研究领域
研究聚焦于土木工程智能调度(Construction Transportation Scheduling),结合深度强化学习(Deep Reinforcement Learning, DRL)与离散事件仿真(Discrete-Event Simulation, DES),解决大规模土方运输中的动态调度问题。
研究动机
大型基础设施项目(如高土石坝)的土方运输面临以下挑战:
1. 动态性与不确定性:机械故障、天气变化、需求波动导致运输效率不稳定。
2. 复杂交互:密集车队在有限空间内易引发排队拥堵,传统方法无法全局优化。
3. 实时响应需求:现有数学模型(如线性规划、遗传算法)计算成本高,泛化能力差。
研究目标
提出一个多任务深度强化学习框架,通过多智能体协同决策,动态分配材料类型、供应场地和运输路线,实现运输时间最小化。
Salabim实现。科学价值
1. 方法论创新:首次将多任务DRL与参数化DES结合,解决了土方运输中动态调度的全局优化问题。
2. 技术贡献:
- LSTM网络捕捉系统长期状态变化,优于传统列表枚举法。
- POPART-A3C显著提升多任务泛化能力,减少奖励干扰。
应用价值
1. 工程实践:模型已成功应用于实际项目,支持实时精益物流控制。
2. 扩展潜力:框架可推广至其他复杂施工场景(如隧道工程、供应链管理)。
其他价值
- 开放源码实现(Python/PyTorch)为后续研究提供基准。
- 集成实时传感器数据(GPS、视频监控)进一步提升仿真精度。
(全文约2000字)