分享自:

基于图神经网络的多智能体协同覆盖控制通信优化

期刊:系统仿真技术DOI:10.16812/j.cnki.cn31-1945.2025.03.002

同济大学电子与信息工程学院的姬仕勋、何铭源、程斌*团队于2025年8月在《系统仿真技术》(System Simulation Technology)第21卷第3期发表了题为《基于图神经网络的多智能体协同覆盖控制通信优化》的研究论文。该研究聚焦复杂环境下多智能体系统的协同覆盖控制问题,提出了一种融合卷积神经网络(CNN)、图神经网络(GNN)和多层感知机(MLP)的层级化智能算法框架,显著提升了环境探测与监控任务的效率。

学术背景

环境探测与覆盖监控技术在环境保护、抗灾救援和资源勘探等领域具有核心价值,但在复杂场景中面临信息分布不均、局部覆盖盲区等挑战。传统覆盖控制方法(如Lloyd算法)依赖预定义环境信息,采用集中式控制策略,难以适应未知或动态环境。近年来,深度学习技术(特别是图神经网络)在多智能体协作中展现出优势,但其在覆盖控制中的应用仍存在感知不完整、通信低效和适应性弱等问题。本研究旨在通过构建CNN-GNN-MLP混合架构,实现多智能体在密集信息分布环境中的自主协同覆盖。

研究流程与方法

1. 算法框架设计

研究提出三层级架构:
- 感知模块:采用四通道CNN处理局部环境数据。输入包括256×256分辨率下采样生成的32×32图像,通道1-2为重要性图(IDF)和边界图(反映障碍物分布),通道3-4编码邻近智能体的归一化坐标。通过3组卷积层(核尺寸3×3,步长1,32通道)提取32维特征向量,使用LeakyReLU(α=0.01)激活函数提升噪声鲁棒性。
- 通信模块:基于GNN实现分布式信息聚合。以智能体为节点、通信链路为边构建图结构,通过归一化邻接矩阵(公式:( S = D^{-12}AD^{-12} ))实现3层图卷积(每层256维特征),并引入门控机制动态调节信息传递权重。
- 动作模块:通过2层MLP(每层32神经元)将GNN输出映射为速度控制指令,经线性层输出x/y方向分量,最大速度限制为5 m/s。

2. 模仿学习与数据集构建

采用基于Voronoi划分的集中式算法作为专家策略,在1,024×1,024 m²仿真环境中生成训练数据:
- 环境建模:随机分布32个高斯特征点(σ∈[40,60])生成IDF,32个智能体初始随机部署(通信半径128 m,传感器视野64 m)。
- 数据采集:记录每5次迭代的状态-动作对(含四通道输入、控制指令及位置),共100,000组数据,使用Adam优化器(学习率10⁻⁴,权重衰减10⁻³)训练模型。

3. 实验验证

  • 性能对比:在相同初始条件下,CNN-GNN-MLP算法的覆盖成本改善率(76.92%)显著优于分布式Voronoi算法(提升29%)和集中式Voronoi算法(提升23%)。
  • 消融实验:移除GNN模块后,覆盖成本平均增加24%,证明GNN对协同决策的关键作用。
  • 鲁棒性测试:对传感器数据添加高斯噪声(σ²=0.1)时,算法性能波动小于5%,显示强抗干扰能力。

主要结果与结论

  1. 感知优化:CNN模块通过局部卷积和权重共享,将环境特征提取效率提升40%,较传统高斯采样方法更适应复杂空间相关性。
  2. 通信效率:GNN模块使智能体在128 m通信半径内实现多跳信息融合,收敛步数减少49%(从159步降至81步)。
  3. 动态适应性:MLP模块通过非线性映射支持实时速度调整,在非凸障碍环境中路径规划成功率提高35%。

研究结论表明,该框架通过数据驱动的特征提取与拓扑自适应的通信机制,解决了传统方法在未知环境中的三大瓶颈:
- 环境感知低效 → CNN提供高精度局部特征
- 协同不足 → GNN实现去中心化信息融合
- 动态适应性差 → MLP生成弹性控制策略

科学价值与应用亮点

  1. 方法论创新:首次将GNN的门控机制引入覆盖控制,通过重置门(公式11)和更新门(公式12)动态平衡历史状态与邻居信息,使通信效率提升28%。
  2. 工程价值:算法在1,024 m²场景中支持64个智能体的实时控制(5 Hz频率),为大规模灾害监测等应用提供技术支撑。
  3. 理论贡献:提出IDF的CNN编码方法,将环境信息密度场转化为可学习的张量表示,为后续研究建立新范式。

研究亮点

  • 跨模态融合:首次将视觉(CNN)、图结构(GNN)与控制(MLP)三级网络端到端结合,覆盖成本降低29%。
  • 可扩展性:智能体数量从16增至64时,算法耗时仅线性增长(R²=0.98),优于传统方法的指数级复杂度。
  • 开源贡献:配套仿真平台集成PyTorch与CUDA加速,支持自定义环境参数与噪声注入测试。

未来工作可探索动态环境下的在线学习机制,以及多目标(如能耗与覆盖率的帕累托优化)协同策略。该研究为智能体集群在复杂场景中的自主作业提供了通用解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com