基于图神经网络的多智能体协同覆盖控制通信优化

分享自：
基于图神经网络的多智能体协同覆盖控制通信优化

期刊:系统仿真技术DOI:10.16812/j.cnki.cn31-1945.2025.03.002
同济大学电子与信息工程学院的姬仕勋、何铭源、程斌*团队于2025年8月在《系统仿真技术》（System Simulation Technology）第21卷第3期发表了题为《基于图神经网络的多智能体协同覆盖控制通信优化》的研究论文。该研究聚焦复杂环境下多智能体系统的协同覆盖控制问题，提出了一种融合卷积神经网络（CNN）、图神经网络（GNN）和多层感知机（MLP）的层级化智能算法框架，显著提升了环境探测与监控任务的效率。
学术背景环境探测与覆盖监控技术在环境保护、抗灾救援和资源勘探等领域具有核心价值，但在复杂场景中面临信息分布不均、局部覆盖盲区等挑战。传统覆盖控制方法（如Lloyd算法）依赖预定义环境信息，采用集中式控制策略，难以适应未知或动态环境。近年来，深度学习技术（特别是图神经网络）在多智能体协作中展现出优势，但其在覆盖控制中的应用仍存在感知不完整、通信低效和适应性弱等问题。本研究旨在通过构建CNN-GNN-MLP混合架构，实现多智能体在密集信息分布环境中的自主协同覆盖。
研究流程与方法1. 算法框架设计研究提出三层级架构：
 - 感知模块：采用四通道CNN处理局部环境数据。输入包括256×256分辨率下采样生成的32×32图像，通道1-2为重要性图（IDF）和边界图（反映障碍物分布），通道3-4编码邻近智能体的归一化坐标。通过3组卷积层（核尺寸3×3，步长1，32通道）提取32维特征向量，使用LeakyReLU（α=0.01）激活函数提升噪声鲁棒性。
 - 通信模块：基于GNN实现分布式信息聚合。以智能体为节点、通信链路为边构建图结构，通过归一化邻接矩阵（公式：( S = D^{-1⁄2}AD^{-1⁄2} )）实现3层图卷积（每层256维特征），并引入门控机制动态调节信息传递权重。
 - 动作模块：通过2层MLP（每层32神经元）将GNN输出映射为速度控制指令，经线性层输出x/y方向分量，最大速度限制为5 m/s。
2. 模仿学习与数据集构建采用基于Voronoi划分的集中式算法作为专家策略，在1,024×1,024 m²仿真环境中生成训练数据：
 - 环境建模：随机分布32个高斯特征点（σ∈[40,60]）生成IDF，32个智能体初始随机部署（通信半径128 m，传感器视野64 m）。
 - 数据采集：记录每5次迭代的状态-动作对（含四通道输入、控制指令及位置），共100,000组数据，使用Adam优化器（学习率10⁻⁴，权重衰减10⁻³）训练模型。
3. 实验验证性能对比：在相同初始条件下，CNN-GNN-MLP算法的覆盖成本改善率（76.92%）显著优于分布式Voronoi算法（提升29%）和集中式Voronoi算法（提升23%）。
 
消融实验：移除GNN模块后，覆盖成本平均增加24%，证明GNN对协同决策的关键作用。
 
鲁棒性测试：对传感器数据添加高斯噪声（σ²=0.1）时，算法性能波动小于5%，显示强抗干扰能力。
 
主要结果与结论感知优化：CNN模块通过局部卷积和权重共享，将环境特征提取效率提升40%，较传统高斯采样方法更适应复杂空间相关性。
 
通信效率：GNN模块使智能体在128 m通信半径内实现多跳信息融合，收敛步数减少49%（从159步降至81步）。
 
动态适应性：MLP模块通过非线性映射支持实时速度调整，在非凸障碍环境中路径规划成功率提高35%。
 
研究结论表明，该框架通过数据驱动的特征提取与拓扑自适应的通信机制，解决了传统方法在未知环境中的三大瓶颈：
 - 环境感知低效 → CNN提供高精度局部特征
 - 协同不足 → GNN实现去中心化信息融合
 - 动态适应性差 → MLP生成弹性控制策略
科学价值与应用亮点方法论创新：首次将GNN的门控机制引入覆盖控制，通过重置门（公式11）和更新门（公式12）动态平衡历史状态与邻居信息，使通信效率提升28%。
 
工程价值：算法在1,024 m²场景中支持64个智能体的实时控制（5 Hz频率），为大规模灾害监测等应用提供技术支撑。
 
理论贡献：提出IDF的CNN编码方法，将环境信息密度场转化为可学习的张量表示，为后续研究建立新范式。
 
研究亮点跨模态融合：首次将视觉（CNN）、图结构（GNN）与控制（MLP）三级网络端到端结合，覆盖成本降低29%。
 
可扩展性：智能体数量从16增至64时，算法耗时仅线性增长（R²=0.98），优于传统方法的指数级复杂度。
 
开源贡献：配套仿真平台集成PyTorch与CUDA加速，支持自定义环境参数与噪声注入测试。
 
未来工作可探索动态环境下的在线学习机制，以及多目标（如能耗与覆盖率的帕累托优化）协同策略。该研究为智能体集群在复杂场景中的自主作业提供了通用解决方案。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问