同济大学电子与信息工程学院的姬仕勋、何铭源、程斌*团队于2025年8月在《系统仿真技术》(System Simulation Technology)第21卷第3期发表了题为《基于图神经网络的多智能体协同覆盖控制通信优化》的研究论文。该研究聚焦复杂环境下多智能体系统的协同覆盖控制问题,提出了一种融合卷积神经网络(CNN)、图神经网络(GNN)和多层感知机(MLP)的层级化智能算法框架,显著提升了环境探测与监控任务的效率。
环境探测与覆盖监控技术在环境保护、抗灾救援和资源勘探等领域具有核心价值,但在复杂场景中面临信息分布不均、局部覆盖盲区等挑战。传统覆盖控制方法(如Lloyd算法)依赖预定义环境信息,采用集中式控制策略,难以适应未知或动态环境。近年来,深度学习技术(特别是图神经网络)在多智能体协作中展现出优势,但其在覆盖控制中的应用仍存在感知不完整、通信低效和适应性弱等问题。本研究旨在通过构建CNN-GNN-MLP混合架构,实现多智能体在密集信息分布环境中的自主协同覆盖。
研究提出三层级架构:
- 感知模块:采用四通道CNN处理局部环境数据。输入包括256×256分辨率下采样生成的32×32图像,通道1-2为重要性图(IDF)和边界图(反映障碍物分布),通道3-4编码邻近智能体的归一化坐标。通过3组卷积层(核尺寸3×3,步长1,32通道)提取32维特征向量,使用LeakyReLU(α=0.01)激活函数提升噪声鲁棒性。
- 通信模块:基于GNN实现分布式信息聚合。以智能体为节点、通信链路为边构建图结构,通过归一化邻接矩阵(公式:( S = D^{-1⁄2}AD^{-1⁄2} ))实现3层图卷积(每层256维特征),并引入门控机制动态调节信息传递权重。
- 动作模块:通过2层MLP(每层32神经元)将GNN输出映射为速度控制指令,经线性层输出x/y方向分量,最大速度限制为5 m/s。
采用基于Voronoi划分的集中式算法作为专家策略,在1,024×1,024 m²仿真环境中生成训练数据:
- 环境建模:随机分布32个高斯特征点(σ∈[40,60])生成IDF,32个智能体初始随机部署(通信半径128 m,传感器视野64 m)。
- 数据采集:记录每5次迭代的状态-动作对(含四通道输入、控制指令及位置),共100,000组数据,使用Adam优化器(学习率10⁻⁴,权重衰减10⁻³)训练模型。
研究结论表明,该框架通过数据驱动的特征提取与拓扑自适应的通信机制,解决了传统方法在未知环境中的三大瓶颈:
- 环境感知低效 → CNN提供高精度局部特征
- 协同不足 → GNN实现去中心化信息融合
- 动态适应性差 → MLP生成弹性控制策略
未来工作可探索动态环境下的在线学习机制,以及多目标(如能耗与覆盖率的帕累托优化)协同策略。该研究为智能体集群在复杂场景中的自主作业提供了通用解决方案。