作者及机构: 马添乐1,2,胡圣波1,2*,熊霞1,2 (1. 贵州师范大学 大数据与计算机科学学院;2. 贵州师范大学 智能信息处理研究所)。
发表信息: 本研究于2025年9月发表在《贵州师范大学学报(自然科学版)》第43卷第5期。
本研究属于无线通信、信号处理与人工智能交叉领域,具体聚焦于认知电子战中的智能抗干扰技术。随着认知电子战的发展,通信系统面临的电磁环境日趋复杂多变,传统跳频通信的抗干扰能力面临严峻挑战。传统干扰检测方法(如能量检测、特征值检测等)在复杂环境中往往存在效率不高、准确性难以维持或计算复杂度过高等问题。同时,传统的伪随机跳频策略在面对智能、自适应的干扰时显得被动和低效。
在此背景下,本研究旨在解决两个核心问题:首先,如何更准确、鲁棒地实现对短波跳频通信系统全频段的实时干扰监测;其次,如何基于感知到的干扰信息,智能、动态地制定最优跳频策略以规避干扰。因此,研究的目标是提出一种结合先进干扰检测与强化学习决策的智能抗干扰整体方案,以提升跳频系统在动态对抗环境下的生存性和通信效能。
本研究的工作流程清晰分为两个核心部分:信道化干扰检测与基于强化学习的抗干扰决策。
第一部分:信道化干扰检测
此部分的目标是准确、实时地获取整个跳频频段内各个子信道的干扰状态。
系统建模与信道化接收:研究首先将短波跳频通信的抗干扰问题建模为一个二分类问题:判断每个信道是否存在干扰。接收信号被建模为仅包含噪声(H0假设)或包含噪声与干扰信号(H1假设)两种状态。为实现全频段快速监测,研究采用了信道化接收机方案。其核心是将宽达数兆赫兹的跳频总带宽B,通过一个由D个滤波器组成的滤波器组,分割成D个并行的子信道,每个子信道的带宽为δf = B/D。这样,系统可以同时并行处理所有子信道的信号,极大提升了监测速度,满足电子战对实时性的要求。
改进型干扰检测算法:对每个并行输出的子信道信号,需要运行干扰检测算法以判断其状态。研究针对经典的前向连续均值去除 (Forward Consecutive Mean Excision, FCME) 算法进行了重要改进。传统FCME及其变体(如差分谱包络FCME (DIFFCME)、双门限FCME (DTFCME))的性能在很大程度上依赖于对初始噪声功率估计的准确性,若初始估计偏差较大,会导致检测性能下降。 本研究所提出的改进算法流程如下:首先,将每个子信道信号进行N点快速傅里叶变换(FFT)得到频谱。然后,将整个频谱划分为若干个长度为M的段(仿真中M=400)。对于每一个频谱段,执行以下迭代过程:
第二部分:基于双深度Q网络 (Double Deep Q-Network, DDQN) 的抗干扰决策
此部分的目标是利用第一部分得到的“信道干扰状态矩阵”,智能地选择未被干扰的信道进行跳频通信。
问题建模:研究将抗干扰决策过程建模为一个马尔可夫决策过程 (Markov Decision Process, MDP)。其核心元素定义如下:
DDQN算法实现:研究采用DDQN这一先进的深度强化学习算法来学习最优跳频策略。DDQN通过两个结构相同但参数更新不同步的神经网络(预估网络和目标网络)来解决传统DQN可能过度估计Q值的问题。其工作流程(如图5所示)如下:
研究的仿真实验分为干扰检测算法性能验证和抗干扰决策模型性能验证两大部分,结果均支持了所提方法的优越性。
第一,改进型FCME干扰检测算法的性能结果。 研究在单音、多音和宽带三种典型干扰下,将所提算法与FCME、DIFFCME、DTFCME以及基础CME算法进行了对比。关键性能指标包括检测率、漏检率和误检率。 * 检测率 (Probability of Detection):如图6-8所示,在相同的低虚警概率(Pf=0.001)下,所提的改进FCME算法在低干扰噪声比 (Interference-to-Noise Ratio, INR) 条件下表现尤为突出。对于所有干扰类型,改进算法都能在更低的INR下达到接近100%的检测率,显著优于其他对比算法。这表明该算法对微弱干扰信号具有更强的检测能力。 * 漏检率 (Missed Detection Rate):如图9-11所示,在两种不同虚警概率(Pf=0.01和0.001)设定下,改进算法的漏检率随INR增加而下降的速度最快,且在高INR下的最终漏检率最低。这验证了算法在准确识别干扰方面的可靠性。 * 误检率 (False Detection Rate):如图12所示,在输入仅为纯噪声(无干扰)的情况下,测试了算法将噪声误判为干扰的概率。结果表明,在高虚警概率设置下,改进算法的误检率显著低于其他所有对比算法。这直接证明了其对初始噪声估计准确性依赖更低的核心优势,因为其他算法在高虚警概率下因门限设置敏感,更容易受噪声波动影响而产生误判。
第二,DDQN抗干扰决策模型的性能结果。 研究设定了两种干扰场景进行测试:随机干扰场景(干扰方随机选择7-9个信道干扰)和规律干扰场景(干扰方周期性干扰15个信道)。将DDQN模型与随机选择、DQN和Dueling DQN模型进行对比,以抗干扰决策成功率(即一个训练回合中选择到无干扰信道的比例)作为核心指标。 * 收敛速度与稳定性:如图13和图14所示,在两种场景下,DDQN模型都展现了最快的收敛速度,其成功率曲线能更快地上升并稳定在高位(接近1)。同时,其训练过程中的成功率波动(图中阴影部分)明显小于DQN和Dueling DQN,表现出更好的学习稳定性。 * 最终性能:在随机干扰场景中,DDQN最终达到的成功率最高;在规律干扰场景中,DDQN与Dueling DQN最终成功率相近,但DDQN的收敛过程更平稳。这证明了DDQN在应对不确定的随机干扰和具有规律的干扰时,均能有效学习并做出优于其他模型的决策。 * 系统整体性能:最终,将完整的智能抗干扰方法(信道化检测+DDQN决策)生成的跳频策略,与传统的伪随机跳频策略在相同干扰条件下进行比较。仿真结果表明,本方法所产生的跳频策略,其归一化吞吐量显著优于传统伪随机策略,从系统通信效率层面验证了整体方案的有效性。
本研究得出结论:所提出的基于信道化干扰检测和双深度Q网络(DDQN)决策的跳频智能抗干扰方法,能够有效提升短波跳频通信系统在复杂认知电子战环境下的性能。
研究中对强化学习模型参数的设置(如表2所示,包括学习率、折扣因子、经验池大小等)进行了明确说明,为后续研究者复现或改进该工作提供了详细参考。此外,研究在仿真中明确了信道数量(D=16)、采样率、干扰参数等细节,保证了实验的可重复性和科学性。