基于多尺度提取与压缩的多域融合高灵敏度干扰识别轻量模型

分享自：
基于多尺度提取与压缩的多域融合高灵敏度干扰识别轻量模型

工程学
电气科学与工程
期刊:IEEE Transactions on Cognitive Communications and NetworkingDOI:10.1109/tccn.2025.3585700
【点击此处】阅读全文、收藏及针对性提问
面向边缘设备的高灵敏度无线干扰识别：一种轻量级多域融合模型
一、 作者、机构与发表信息
本研究报告基于一篇题为《Multi-Domain Fusion for High-Sensitivity Interference Identification: A Lightweight Model Using Multi-Scale Extraction and Compression》的学术论文。该论文的主要作者包括：Zehui Zhang, Jianping An (IEEE高级会员), Neng Ye (IEEE会员, 通讯作者), Xuefei Li, Dusit Niyato (IEEE会士) 以及 Kai Yang (IEEE会员)。作者单位分别来自北京理工大学网络空间科学与技术学院（Zehui Zhang, Jianping An, Neng Ye, Xuefei Li）、北京理工大学信息与电子学院（Kai Yang）以及新加坡南洋理工大学计算机科学与工程学院（Dusit Niyato）。该论文已被IEEE Transactions on Cognitive Communications and Networking (IEEE TCCN) 期刊接收发表。论文的研究工作得到了中国国家自然科学基金（项目号：U23B2005, 62371047）和北京市自然科学基金（项目号：JQ23015）的支持。
二、 学术背景与研究目标
本研究属于无线通信与人工智能交叉领域，具体聚焦于无线干扰识别（Wireless Interference Identification, WII）这一关键技术。WII对于保障通信安全与可靠性至关重要，在频谱感知、电子战、网络空间安全等领域有广泛应用。随着通信设备日益微型化，在资源受限的边缘节点部署WII模型的需求日益迫切。传统的WII方法包括基于似然的方法和基于手工特征的方法，前者计算复杂且需要信道信息，后者设计复杂且依赖专家知识。近年来，基于深度学习（Deep Learning, DL）的WII方法凭借其自动特征提取和数据挖掘能力展现出巨大潜力。
然而，现有研究面临两大挑战：1) 低干信比（Interference-to-Signal Ratio, ISR）下识别性能下降：当干扰信号较弱时，其特征与合法信号高度混淆，导致识别准确率低。2) 模型复杂度与性能的权衡：现有基于多域融合（Multi-Domain Fusion, MDF）的方法虽然通过融合不同域（如时域、频域、时频域）的互补特征提升了性能，但通常模型参数量大、计算复杂，难以部署在资源受限的边缘设备上。
因此，本研究旨在解决一个核心矛盾：在保持模型轻量化的同时，实现低ISR下的高灵敏度干扰识别。具体研究目标包括：1) 设计一种轻量级多域交叉融合网络模型，显著降低模型参数量和计算复杂度；2) 通过引入信息论方法，减少多域特征中的冗余信息，提升模型在低ISR下的识别精度；3) 设计有效的训练策略，平衡来自不同域和不同尺度特征的重要性，防止模型过度依赖某一特定域。
三、 详细研究流程与方法
本研究提出了一种名为轻量级多域交叉融合网络（Lightweight Multi-domain Cross-Fusion Network, LMCFN）的模型。其整体工作流程包含以下几个核心步骤：
1. 信号建模与多域表示： 研究首先对接收信号进行建模，考虑了合法信号与带内干扰信号在多径衰落信道下的叠加。为了从不同视角提取干扰特征，研究采用了两种域变换方法： * 时频域变换：使用短时傅里叶变换（Short-Time Fourier Transform, STFT）生成时频图像（Time-Frequency Image, TFI）。STFT能有效分析信号的局部时频特性。 * 分数阶傅里叶域变换：使用分数阶傅里叶变换（Fractional Fourier Transform, FrFT）生成分数阶傅里叶图像（FrFT Image, FrFTI）。FrFT能捕获信号在时频平面上的旋转特性，擅长分析复杂的非线性频率变化。 这两种变换具有互补性，且计算复杂度相对较低，为后续的多域融合提供了基础。
2. 轻量级多域交叉融合网络（LMCFN）架构： LMCFN是整个研究的核心，其结构主要包括四个部分：多尺度特征提取（Multi-scale Feature Extraction, MFE）模块、单域信息瓶颈（Single-domain Information Bottleneck, SIB）模块、多域特征交叉融合（Multi-domain Feature Cross-Fusion, MFCF）模块以及融合域信息瓶颈（Fused-domain Information Bottleneck, FIB）模块。模型以TFI和FrFTI作为并行输入。
流程A：单域多尺度特征提取与压缩 * MFE模块：对每个输入域（TFI或FrFTI），MFE模块采用双分支结构并行提取特征。 * CNN分支：使用深度可分离卷积（Depthwise Separable Convolution, DWConv）和瓶颈层（Bottleneck）构建轻量级卷积网络，专注于提取图像的局部特征。DWConv相比标准卷积可大幅减少参数。 * Transformer分支：首先通过Pixel Unfold层处理特征，然后使用改进的轻量级Transformer结构（采用分组注意力机制，仅在同组令牌内计算注意力，而非全局），专注于提取图像的全局特征。 两个分支的输出分别是代表局部特征的嵌入补丁令牌（Embedded Patch Tokens）和代表全局特征的类别令牌（Class Token）。 * SIB模块：为了减少每个分支提取特征中的冗余信息，研究在MFE的每个分支后引入了基于变分信息瓶颈理论的压缩模块。SIB包含一个编码器和一个解码器。编码器将输入特征映射为一个高斯分布的均值（μ）和方差（σ），通过重参数化技巧得到压缩后的特征表示。其优化目标是最大化压缩特征与干扰类别标签之间的互信息，同时最小化压缩特征与原始输入特征之间的互信息。通过推导出的互信息下界作为损失函数的一部分，引导网络保留与识别任务最相关的信息，过滤冗余。
流程B：多域特征融合与压缩 * MFCF模块：该模块负责融合来自两个域（TFI和FrFTI）的、经过压缩的多尺度特征。其核心是一个改进的交叉注意力（Cross-Attention, CA）机制。 * 交叉注意力融合：对于一个域，使用其类别令牌作为查询（Query），将自身与另一个域的嵌入补丁令牌拼接后作为键（Key）和值（Value），进行注意力计算。这样，一个域的全局特征（类别令牌）可以聚合另一个域的局部细节信息（嵌入补丁令牌）。此过程在两个域间对称进行，生成两个新的、融合了跨域跨尺度信息的类别令牌。 * 深度可分离卷积融合：将上述两个新生成的类别令牌拼接，并通过一个DWConv层进行进一步融合与降维，输出一个统一的融合特征令牌。 * FIB模块：与SIB类似，FIB模块对MFCF输出的融合特征进行进一步的压缩和去冗余，原理与SIB相同，旨在从融合特征中提取最任务相关的紧凑表示。最终，该表示通过一个全连接层和Softmax函数输出干扰类型的概率分布。
3. 自适应加权级联损失函数与训练策略： 为了解决多域多分支训练中的不平衡问题，研究设计了一种自适应加权级联（Adaptive Weighted Cascaded, AWC）损失函数，它由两部分级联而成： * 分支依赖损失（Branch-Dependent Loss, BD Loss）：用于平衡同一域内CNN分支和Transformer分支的重要性。该损失为每个分支的损失动态学习一个权重参数（σ），自动降低大损失分支的影响，提升小损失分支的影响，确保模型均衡利用不同尺度的特征。 * 梯度混合损失（Gradient Blending Loss, GB Loss）：用于平衡不同域（TFI域、FrFTI域）以及融合域在训练中的收敛速度。通过引入一个新的度量——多域过拟合与泛化比（Multi-domain Overfitting to Generalization Ratio, MOGR），该损失函数能够自动计算并更新各域损失的最优权重（ω_m, ω_f），防止模型过度拟合某一特定域而忽视其他域。 研究还提出了收敛率调度（Convergence Rate Scheduling, CRS）训练方法，将训练周期划分为常规周期和超周期，分别在每个周期更新BD Loss的权重，在每个超周期更新GB Loss的权重，从而高效地训练整个LMCFN模型。
4. 实验设计与评估： 研究构建了一个包含11种常见无线干扰类型（如单音、多音、部分带噪声、线性调频等）的数据集。数据集考虑了不同的ISR（从-25 dB到10 dB）、多径衰落信道以及干扰持续时间（长持续和短持续）等多种复杂场景。 * 对比基准：研究进行了广泛的对比实验，包括： 1. 单域性能对比：将提出的MFE模块与多个先进的轻量级模型（如MobileViT, MobileNetV2/V4, EfficientFormer）及其简化版本在TFI和FrFTI单域输入下进行对比，评估其识别精度和参数量。 2. 融合方法对比：比较了CA融合与其他五种融合方法（CNN融合、Transformer融合、MLP融合、决策融合、门控融合）的性能和计算开销。 3. 信息瓶颈有效性验证：对比了LMCFN在不使用IB、仅使用单域IB、仅使用融合域IB以及使用多域IB（即SIB+FIB）四种配置下的识别性能。 4. 损失函数有效性验证：对比了使用交叉熵损失、BD Loss、GB Loss以及完整的AWC Loss时模型的训练收敛情况和最终精度。 5. 整体性能对比：将完整的LMCFN模型与参数规模相近的其他多域融合模型（如改进的WII-MDN模型以及基于MobileViT_s和MobileNetV4_s构建的MDF模型）进行综合性能对比。
四、 主要研究结果
实验结果表明，本研究提出的LMCFN模型在多个方面取得了显著优势：
单域特征提取模块（MFE）的高效性：在单域（TFI或FrFTI）干扰识别任务中，MFE模块在极低的参数量下，取得了与或优于先进轻量级模型的识别精度，尤其是在低ISR（如-21 dB, -16 dB）下表现突出。具体数据显示，MFE模块的参数量仅为0.166M，相较于MobileViT模型（2.003M）减少了91.7%。表III进一步展示了不同干扰类型在TFI和FrFTI域上的识别性能存在差异，例如在-20 dB ISR下，单音干扰在TFI上识别准确率更高（0.91 vs 0.70），而QPSK干扰则在FrFTI上更优（0.62 vs 0.82），这从数据上证实了多域融合的必要性。
交叉注意力融合方法的优越性：在-21 dB ISR下，对比六种融合方法，CA融合在取得最高识别精度的同时，保持了较低的浮点运算数（FLOPs）和参数量（见图7），证明了其对于轻量级多尺度特征融合的有效性。
多域信息瓶颈（IB）的有效性：图8的混淆矩阵清晰显示，在-22 dB ISR下，LMCFN模型随着IB模块的引入（从无IB，到仅融合域IB，到仅单域IB，再到多域IB），识别性能逐步提升。使用多域IB（SIB+FIB）的模型取得了最佳的总体识别精度，这表明IB模块成功过滤了单域和融合域中的冗余信息，增强了特征在低信噪比下的判别力。
自适应加权级联（AWC）损失函数的有效性：图9展示了不同损失函数下的训练曲线。使用AWC Loss的LMCFN模型，其识别精度随着训练周期增长而持续显著提升，并最终稳定在高于其他损失函数的水平。这验证了BD Loss平衡分支重要性以及GB Loss平衡多域收敛速度的有效性。
LMCFN整体性能的领先性：综合对比实验（图10, 11, 12）表明，在参数规模相近的前提下，LMCFN模型在多种测试场景下均取得了最佳的识别性能。
在无多径效应的标准场景下，在低ISR区域，LMCFN相比先进的多域融合（MDF）模型（WII-MDN）识别准确率提升了11%。
在存在多径衰落的更复杂场景下，对于长持续时间干扰，LMCFN准确率提升6.5%；对于短持续时间干扰，提升幅度达到8.9%。
模型参数量为874.528K，低于WII-MDN的1200K，虽然FLOPs和推理延迟略有增加，但在精度-复杂度权衡上表现优异。
五、 研究结论与价值
本研究成功提出并验证了一种适用于资源受限边缘设备的高灵敏度、轻量级无线干扰识别解决方案。主要结论如下： 1. 模型架构创新：提出的LMCFN模型通过轻量级多尺度特征提取（MFE）、高效的多域交叉注意力融合（MFCF）以及多域信息瓶颈（IB）的协同设计，在极低的模型复杂度下，实现了对低干信比带内干扰的高精度识别。 2. 训练策略创新：设计的自适应加权级联损失函数（AWC Loss）与收敛率调度（CRS）训练方法，有效解决了多域多分支模型训练中的不平衡问题，是模型取得高性能的关键。 3. 性能突破：实验证明，该模型在参数量大幅减少（特征提取模块减少91.7%）的同时，在低ISR下的识别准确率显著超越现有先进多域融合模型。
本研究的科学价值在于为轻量级多域融合模型设计提供了新的思路，将信息瓶颈理论、注意力机制与轻量化网络结构有机结合，为解决模型效率与精度之间的矛盾提供了可行方案。其应用价值显著，所提出的模型可直接部署于微型化、低功耗的边缘通信设备（如物联网终端、小型无人机、便携式通信装备等），用于实时、精准的干扰检测与分类，从而提升通信系统的抗干扰能力和频谱管理智能化水平，在民用和军事领域均有广阔的应用前景。
六、 研究亮点
问题定义精准：紧扣边缘计算场景下“轻量化”与“高灵敏度”的核心需求，针对低ISR、带内干扰识别这一实际难点展开研究。
方法集成创新：并非简单堆砌现有技术，而是创造性地将多尺度特征提取（CNN+Transformer）、信息瓶颈理论（用于单域和融合域去冗余）、交叉注意力机制（用于高效跨域融合）以及动态损失加权策略融为一体，形成了一个完整、高效、轻量的解决方案。
理论推导支撑：论文不仅提出了模型和损失函数，还通过严格的数学推导（见附录），给出了信息瓶颈互信息下界的表达式以及梯度混合损失中最优权重的闭式解，增强了方法的理论严谨性。
实验验证充分：构建了贴近实际场景的复杂数据集，并设计了层次分明、对比全面的实验方案，从模块级到系统级，从单域到多域，从算法组件到整体性能，全方位验证了所提方法的有效性和优越性，结论令人信服。
七、 其他有价值内容
论文在附录中提供了关键公式的详细推导过程，包括： * 附录A：推导了变分信息瓶颈中互信息下界的具体形式，为SIB和FIB模块的损失函数提供了理论基础。 * 附录B：推导了分支依赖损失函数，解释了其如何通过引入可学习的噪声标量来自适应调整分支权重。 * 附录C：推导了梯度混合损失函数中最优权重的计算公式，展示了如何通过最小化MOGR来平衡多域梯度。
这些推导不仅完善了论文的理论体系，也为其他研究者理解和复现该方法，甚至在此基础上进行拓展，提供了清晰的指引。此外，论文对模型中各模块的参数和计算量进行了详细分析（见表V和图13），指出了单域IB中CNN分支参数较大的问题，为未来的进一步优化指明了方向。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问