基于多智能体强化学习的协同智能干扰方案防止空中窃听

分享自：
基于多智能体强化学习的协同智能干扰方案防止空中窃听

期刊:IEEE Transactions on Mobile ComputingDOI:10.1109/TMC.2024.3505206
类型a
这篇研究由Qubeijian Wang、Shiyue Tang、Wen Sun（孙文）、Yin Zhang（张寅）、Geng Sun（孙庚）、Hong-Ning Dai（戴弘宁）和Mohsen Guizani等作者完成，他们分别隶属于西北工业大学网络安全学院、电子科技大学信息与通信工程学院、吉林大学计算机科学与技术学院、香港浸会大学计算机科学系以及阿联酋穆罕默德·本·扎耶德人工智能大学机器学习系。该研究发表在《IEEE Transactions on Mobile Computing》2025年4月第24卷第4期。
学术背景： 随着自主飞行器（AAV, Autonomous Aerial Vehicles）技术的进步，它们在环境监测、军事行动和民用应用等领域中变得不可或缺。然而，这些飞行器如果被敌对势力控制或伪装，将对无线通信安全构成重大威胁。由于其高机动性和灵活性，AAVs可以悬停在战略位置拦截无线信道上的机密数据，成为窃听者。这种威胁在军事行动和民用部门尤为严重。因此，开发有效的反窃听措施对于保护无线通信系统的完整性至关重要。
物理层安全（PLS, Physical Layer Security）技术已被证明在通过破坏窃听信道来减轻窃听威胁方面具有优越性。友好的干扰作为一种经典的PLS技术，通过发射人工噪声降低窃听信道的信号干扰加噪声比（SINR）。相比其他PLS技术如波束成形，友好的干扰在对抗AAV窃听方面更为有效，因为它可以根据AAV窃听者的位置、网络规模和信道质量灵活部署。此外，由于空对地（A2G）链路通常比地面到地面（G2G）链路具有更好的信道质量，地面干扰器对AAVs的干扰效果优于对地面用户的干扰效果。因此，研究利用移动地面干扰器（GJs, Ground Jammers）找到最佳移动轨迹和功率以对抗AAV窃听同时确保合法通信质量。
详细工作流程： 该研究包括以下几个主要步骤： 1. 系统模型和问题描述： 研究首先提出了一个合作智能干扰方案，用于保护被AAV窃听的无线地面网络。具体而言，多个GJs动态优化其轨迹和干扰功率，在AAV窃听者和合法用户之间生成特定的干扰屏蔽。然后，研究制定了联合轨迹和干扰功率优化问题，以最大化整体保密容量。 2. 信道模型： 包括地面通信链路（G2G）和空中到地面通信链路（A2G）。G2G链路主要经历瑞利衰落和路径损耗效应，而A2G通信主要包括视距（LOS）链路和非视距（NLOS）链路。 3. 问题公式化： 为了保证安全传输的质量，GJs需要在降级合法传输的同时增强对窃听传输的干扰。为此，GJs需要尽可能靠近AAV窃听者，同时远离合法用户。此外，为了最小化对合法传输的影响，GJs需要高效合理地分配干扰功率。因此，通过联合轨迹设计和干扰功率分配，制定了一种优化问题以最大化保密容量。 4. 强化学习解决方案： 研究提出了一种基于深度强化学习（DRL, Deep Reinforcement Learning）的解决方案来解决总体保密容量最大化问题。优化问题被重新表述为分散部分可观测马尔可夫决策过程（Dec-POMDP, Decentralized Partially Observable Markov Decision Process）。然后，研究提出了一种基于双Q学习和竞争网络（Dueling DDQN, Dueling Double Deep Q-Network）的算法，并引入了基于QMIX框架的混合网络以实现所有GJs的协作干扰。
主要结果： 1. 系统模型和问题描述： 研究成功建立了系统模型并描述了问题。仿真结果显示，所提出的方案能够在确保合法传输的前提下最大程度地防止AAV窃听，优于基准方案。 2. 强化学习解决方案： 在训练阶段，所有算法在2000个训练回合后逐渐收敛。与其他多智能体强化学习（MARL, Multi-Agent Reinforcement Learning）算法相比，所提出的算法具有稳定的收敛性。这意味着代理网络的竞争网络在巨大的状态空间和动作空间中具有主导优势，以防止多个AAV窃听。此外，所提出的算法获得的累积奖励高于其他算法，包括非信息共享MARL（即VDNs）。这表明基于QMIX框架的所提算法是合理且有效的。此外，所提出的算法接近理论优化。 3. 性能分析： 研究评估了不同设置下的算法性能。例如，较大的学习率（如学习率=10^-3）可能导致训练模型显著波动，难以找到最优策略；较小的学习率（如学习率=10^-5）则导致模型训练时间过长。因此，合理的学习率对于实际实施所提算法至关重要，即学习率设为10^-4。
结论及意义： 该研究提出了一个基于QMIX的合作智能干扰方案，以防止AAV窃听。通过约束GJs的移动性，研究制定了总体保密容量最大化问题。然后，提出了一种基于QMIX的合作干扰算法，使GJs能够独立做出决策而无需共享观察。仿真结果表明，所提出的方案有效地实现了多个GJs之间的干扰轨迹设计和干扰功率分配。此外，所设计的惩罚项有效减轻了地面干扰器对合法传输的干扰，同时确保了保密能力。即使GJs和AAV窃听者的移动速度极不均匀，整体保密能力也能得到有效保障。
研究亮点： 1. 重要发现： 提出了一种合作智能干扰方案，以防止AAV窃听。 2. 方法新颖性： 利用基于QMIX的合作干扰算法，使GJs能够独立做出决策而无需共享观察。 3. 特殊性： 所提方案在确保合法传输的前提下最大程度地防止AAV窃听，优于基准方案。
其他有价值内容： 未来的研究方向包括探讨能量消耗与干扰效率之间的权衡、多模态数据驱动的合作干扰以及干扰与窃听之间的博弈。这些方向将进一步增强合作智能干扰的性能。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问