分享自:

基于多智能体图神经网络的城市无人机配送路径优化

期刊:交通运输工程与信息学报DOI:10.19961/j.cnki.1672-4747.2025.06.031

基于多智能体图神经网络的城市无人机配送路径优化研究学术报告

作者及机构
本研究由周星宇(马来亚大学计算机科学与信息系统学院)、李姝涵(马来亚大学理学院)、薛锋(西南交通大学交通运输与物流学院/综合交通大数据应用技术国家工程实验室)合作完成,发表于《交通运输工程与信息学报》(Journal of Transportation Engineering and Information),网络首发时间为2025年8月21日,DOI编号10.19961/j.cnki.1672-4747.2025.06.031。


学术背景
本研究属于智能交通与运筹优化交叉领域,聚焦城市低空经济中的无人机物流配送问题。随着智慧城市发展,传统物流面临交通拥堵、最后一公里配送效率低等挑战,而无人机配送技术因其三维空间机动性成为解决方案。然而,多机巢协同配送系统(Multi-Depot UAV Delivery System, MDUAVDS)需应对路径规划、静态禁飞区(No-Fly Zone)避障、恒定风场扰动等多重复杂约束,传统车辆路径问题(Vehicle Routing Problem, VRP)模型难以直接适用。现有研究在动态环境适应性、全局优化能力等方面存在局限,因此本研究提出融合多智能体系统(Multi-Agent System, MAS)与图神经网络(Graph Neural Network, GNN)的混合优化框架(MAS-GNN),旨在实现配送路径最短、能耗最低且避障安全的综合目标。


研究流程与方法
1. 问题建模阶段
- 场景构建:以30个客户点、10个配送中心的城市区域为对象,模拟包含静态禁飞区与恒定风场的三维空间环境,采用有向图建模节点(客户点、配送中心)与边(飞行路径)。
- 约束整合:建立多目标混合整数规划模型,涵盖载重限制、电池容量、时间窗、禁飞区规避(通过线性化距离约束实现)及无人机空域冲突(通过高度层离散化与时间偏移变量解决)。
- 创新模型:首次将MAS的分布式协同决策能力与GNN的图结构学习能力结合,提出MAS-GNN框架。其中,MAS负责局部任务分配与冲突协调,GNN通过图注意力网络(Graph Attention Network, GAT)学习路径节点的时空关联性,生成优先级评分。

  1. 算法开发阶段

    • 两阶段初始化:首先生成不考虑约束的“巨型路径”(Giant Tour),再通过2-opt局部优化切割为可行子路径。
    • 强化学习优化:采用近端策略优化(Proximal Policy Optimization, PPO)算法训练智能体,奖励函数融合能耗、路径长度及禁飞区违规惩罚(公式23)。
    • GNN评分机制:GAT网络动态分配节点注意力权重,例如对紧迫时间窗客户或临近禁飞区路径赋予更高重要性,输出边评分以指导路径选择(图4)。
  2. 实验验证阶段

    • 参数设定:基于大疆Matrice 300 RTK无人机实测数据,设定巡航速度10 m/s、旋翼面积0.0064 m²、电池容量280 W·h等参数。
    • 对比基准:与深度强化学习(DRL)和基于Transformer的规划模型对比,MAS-GNN在相同硬件条件下训练500轮次。
    • 评估指标:总成本(固定启用成本+能耗成本+时间窗违约成本)、路径冲突次数、收敛速度。

主要结果
1. 算法性能
- MAS-GNN总成本为24,700元,较DRL(25,850元)降低5.22%,较Transformer模型(25,200元)降低2.77%(表3)。
- 收敛速度显著优于基线,400轮次内达到稳定(图7),验证了GNN引导的搜索效率。

  1. 路径优化

    • 各配送中心平均服务3个客户点,航迹呈“短链闭环”模式(图9),例如路径(D_1 \rightarrow C_1 \rightarrow C_2 \rightarrow C_3 \rightarrow D_1)成本为2,600元(表2)。
    • 高度层调度有效规避冲突:无人机1与2在节点2和5通过分配不同高度层(层2与层3)避免空域重叠(图10)。
  2. 环境适应性

    • 静态禁飞区规避成功率100%,风场扰动下能耗波动幅度较基线减少12%。GNN训练损失稳定收敛(图6),表明其对复杂拓扑的泛化能力。

结论与价值
1. 科学价值
- 提出首个MAS-GNN协同框架,为多约束无人机路径规划问题提供了新范式。
- 通过GAT网络实现异质性节点关系建模,弥补了传统GCN(Graph Convolutional Network)与GIN(Graph Isomorphism Network)在动态重要性分配上的不足。

  1. 应用价值
    • 可扩展至城市物流、应急物资投送等场景,支持多机巢实时协同调度。
    • 算法开源代码可为低空交通管理系统提供模块化组件。

研究亮点
1. 方法创新:MAS与GNN的深度耦合,兼具分布式决策与全局结构感知能力。
2. 约束全面性:首次同时集成禁飞区、风场、时间窗、空域冲突等现实约束。
3. 工程可落地性:基于实际无人机参数验证,结果可直接指导商业部署。


其他价值
- 提出的高度层离散化方法为城市空域管理提供了标准化冲突解决思路。
- 超参数敏感性分析(图8)表明学习率最优范围为(10^{-3}),为后续研究提供调参依据。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com