TD-AMRKNet:一种基于扩散模型的海杂波抑制新框架
一、 作者、机构及发表信息
本研究由烟台大学计算机与控制工程学院的杜晓林(Xiaolin Du)和马迪(Di Ma)、海军航空大学的陈小龙(Xiaolong Chen)、电子科技大学信息与通信工程学院的崔国龙(Guilong Cui)以及西安电子科技大学雷达信号处理全国重点实验室的郑纪彬(Jibin Zheng)合作完成。论文标题为“TD-AMRKNet-Based Radar Image Processing Framework for Sea Clutter Suppression”,已被 IEEE Transactions on Radar Systems 期刊接收并预发表(预出版日期:2026年)。本研究工作获得了中国国家重点研发计划、国家自然科学基金、山东省自然科学基金、烟台市科技创新发展计划基础研究项目以及云南大学云南省统计建模与数据分析重点实验室开放研究基金等多个项目的支持。
二、 学术背景与目标
本研究属于雷达信号处理与人工智能交叉领域,具体聚焦于海杂波抑制这一关键挑战。海杂波是雷达波束照射海面时,由海浪、海风等因素引起的后向散射回波,是海上雷达目标检测的主要干扰源,严重影响对低空、慢速、小目标的检测性能。随着海洋开发和国防建设的推进,对海面目标雷达检测的需求日益迫切。
传统海杂波抑制方法包括自适应滤波、时频滤波、背景建模等,在特定条件下有效,但在复杂的动态海洋环境中面临挑战,且泛化能力有限。近年来,基于深度学习的方法,特别是卷积神经网络(CNN)、生成对抗网络(GAN)和Transformer架构,展现出巨大潜力。然而,现有方法在处理极端海况和复杂目标场景时仍有提升空间,且大多基于单一类型雷达数据,对多源异构雷达数据的综合利用不足。
针对上述问题,本研究提出了一种创新的深度学习框架——三元扩散注意力多尺度Res-KAN网络(Triplet Diffusion Attention Multi-Scale Res-KAN Net, TD-AMRKNet)。其研究目标是:设计一个轻量、高效、泛化能力强的网络架构,能够有效抑制不同类型雷达数据(包括凝视雷达产生的时频谱图和扫描雷达产生的平面位置显示器(PPI)图像)中的海杂波,提升目标检测的精度与鲁棒性。
三、 研究内容与工作流程
本研究的工作流程系统地涵盖了数据准备、网络架构设计、实验配置、性能评估与分析等多个环节。
1. 数据集构建与增强 * 研究客体:创建了六个真实海杂波数据集(A-F)。其中,数据集A(IPIX)、B(CSIR)、C(取自《雷达学报》2022年1期)为来自凝视雷达的时频谱图;数据集D(More Lands)、E(Less Lands)和F(取自《雷达学报》2021年1期)为来自扫描雷达的PPI图像。每个数据集包含“有杂波”的图像和对应的“无杂波”纯目标图像(目标图像部分来自真实数据,部分通过仿真或数据平衡机制生成)。 * 处理方法:对于PPI图像数据集D和E,由于真实样本数量有限(仅440对有杂波/目标图像),研究团队采用了改进的深度卷积生成对抗网络(DCGAN)进行数据增强。他们对原始DCGAN的网络结构和训练策略进行了系统改进:在生成器和判别器中加入了额外的卷积层、归一化层和采样层以提升PPI图像的生成质量和特征保真度;引入了数据平衡机制和多GPU并行训练策略以提高模型的泛化能力和收敛效率。最终,生成了336对额外的图像,使训练集规模与目标图像数量(776张)相匹配。这一步骤有效扩展了数据集规模和多样性,为后续模型训练奠定了数据基础。
2. 核心网络架构设计 研究的核心是提出了TD-AMRKNet架构。它是一个基于扩散模型(Diffusion Model) 的U形网络,其创新主要体现在两个方面:一是引入了新型的AMRK模块,二是集成了三元注意力(Triplet Attention)机制。 * 整体框架:网络以扩散模型为框架,包含输入层、下采样模块、中间模块、上采样模块和输出层。下采样和上采样过程均包含多个层级,每个层级包含AMRK模块和采样操作(下采样为步长为2的卷积,上采样为恢复尺寸的卷积)。这种U形结构利于多尺度特征的提取与融合。 * 创新模块一:AMRK模块。这是TD-AMRKNet的核心模块,旨在高效捕获图像的远程依赖和细节特征,其设计包含多个子模块: * 多尺度广义空间卷积(Multi-Scale-GSConvs)模块:采用不同扩张率的卷积核组合,使网络能在多个感受野范围内提取空间特征,既能感知小海目标的细粒度局部纹理,也能感知海杂波背景的全局变化模式。相比传统卷积,该模块在更少的参数量下实现了更强的特征提取能力。 * 空间注意力(SA)模块:基于卷积块注意力模块(CBAM)中的空间注意力设计,使用7×7卷积核生成空间注意力图,引导网络关注包含目标的关键区域,同时抑制无关的杂波区域。 * 知识注意力网络(KAN)模块:基于Kolmogorov-Arnold表示定理(KART)实现,通过动态调整的卷积核权重和通道关系,自适应地选择最合适的卷积核来处理不同位置的特征,增强了网络的适应性和特征聚焦能力。 * 通道压缩注意力(CRA)模块:通过全局平均池化、全连接层和激活函数计算通道重要性权重,对特征图的通道进行加权和筛选,突出关键信息,抑制冗余通道,提升网络的表征能力和计算效率。 * 门控机制与残差连接:模块内设计了门控机制和残差连接,动态调节通道与空间特征间的信息流,增强了与目标相关的显著特征,同时抑制海杂波。AMRK模块的引入使得整个网络参数量大幅减少至仅3.46百万(3.46M)。 * 创新模块二:三元注意力(Triplet Attention)机制。该机制被集成在网络中间模块以及部分下采样和上采样模块中。与传统单轴注意力不同,三元注意力通过三个分支分别捕获通道-宽度、高度-通道以及空间维度间的信息交互,增强了网络对不同尺度特征的敏感性。它帮助模型在海杂波图像中动态聚焦于关键区域,从而提升了特征表示能力。 * 整体处理流程:输入的海杂波图像(时频谱图或PPI图)首先经过初始卷积层映射至高维特征空间。随后,通过一系列包含AMRK模块和三元注意力的下采样层逐步提取深层特征并压缩空间尺寸。在网络的“瓶颈”层(中间模块),特征经过进一步的精炼。最后,通过对称的上采样层和AMRK模块,结合跳跃连接传递的浅层特征,逐步恢复图像尺寸并重建出抑制了杂波的目标图像。整个过程平均仅需约0.0305秒。
3. 实验配置与评估 * 实验环境:研究在配备双NVIDIA 3090 GPU的高性能计算平台上进行,使用PyTorch 2.0.0框架。 * 对比方法:为了全面评估TD-AMRKNet的性能,研究者将其与多种先进方法进行了对比,包括自适应去噪网络(ADN)、用于海杂波抑制的GAN(SCS-GAN)、基于扩散模型的RadarDiff、多头部自注意力网络(MHA-DNet)、CycleGAN、Pix2Pix以及经典的ResNet。 * 评估指标:采用四种指标定量评估杂波抑制效果: 1. 峰值信噪比(PSNR):衡量抑制后图像与无杂波目标图像之间的像素级误差,值越高越好。 2. 结构相似性指数(SSIM):衡量两幅图像在结构、亮度和对比度方面的相似性,值越接近1越好。 3. P-S指标:一种基于多目标遗传算法(NSGA-II)的综合性能指标,旨在同时最大化PSNR和最小化(1-SSIM),其值反映了算法在PSNR和SSIM间的综合权衡性能,值越大越好。 4. 杂波抑制比(CSR):评估杂波被去除的程度。计算抑制前后图像中高幅值区域(代表杂波)的平均功率比,并对数化。该值为负,越接近0表示抑制效果越好。 * 实验流程: * 模型训练与测试:将每个数据集的训练集按8:2划分为训练和验证集,模型训练1200轮次。在独立的测试集上评估最终性能。 * 消融实验:为了验证三元注意力和AMRK模块各自的作用,设计了两个变体模型:D-AMRKNet(移除三元注意力)和TD-Net(用标准ResNet替换AMRK主干网络)。在相同设置下训练和评估,以P-S指标作为主要评判标准。 * 下游任务验证:为了证明杂波抑制的实际价值,将抑制前后的PPI图像(数据集D, E, F)输入到先进的目标检测器YOLOv8中,比较目标检测的平均精度均值(mAP)、精确率(Precision)和F1分数,直观展示杂波抑制对提升检测性能的贡献。
四、 主要结果与分析
1. 模型复杂度与效率:TD-AMRKNet仅包含3.46M参数,显著少于典型的轻量级扩散模型(如LWTDM的11.59M, LightGrad的5.89M)及其他对比网络(如U-KAN的8.95M, MHA-DNet的3.50M)。同时,其整体平均(OA)处理时间(0.0305秒)优于大多数对比方法,展示了其作为高效、紧凑网络的优势。
2. 海杂波抑制性能定量对比:在全部六个数据集上的定量评估表明,TD-AMRKNet在PSNR、SSIM、P-S和CSR四个指标上均取得了最具竞争力或最优的性能。例如,在时频谱图数据集B(CSIR)上,其PSNR达到37.60,SSIM达到0.994,远超其他方法;在PPI图像数据集E上,其PSNR达到32.38。性能曲线图显示,TD-AMRKNet的性能表现最为稳定和优异,而ResNet和MHA-DNet等方法的性能在不同数据集间波动较大。SCS-GAN和CycleGAN虽然表现较好,但整体上仍逊于TD-AMRKNet。
3. 消融实验结果:消融实验清晰地证明了两个核心组件的有效性。在所有数据集上,完整的TD-AMRKNet的P-S指标均高于其变体。移除三元注意力(D-AMRKNet)会导致性能显著下降(如在数据集B上P-S从25.39降至19.10),表明三元注意力在捕获跨维度依赖、增强特征判别力方面不可或缺。用ResNet替换AMRK主干(TD-Net)同样导致性能大幅下滑(如在数据集B上P-S降至16.98),证明了AMRK模块在多尺度特征提取和轻量化设计方面的优越性。结果表明,AMRK模块和三元注意力机制具有显著的协同效应。
4. 在真实数据上的可视化效果:研究展示了TD-AMRKNet在IPIX、CSIR及《雷达学报》等多个真实数据子集上的处理结果。可视化对比显示,相比于ResNet(导致目标细节丢失、出现RGB色渗)和RadarDiff(未能完全抑制边缘噪声),TD-AMRKNet能够更干净地去除杂波,同时更完整地保留和恢复目标形状与细节。对于PPI图像,相比SCS-GAN(可能造成目标部分丢失或增加)和CycleGAN(可能引入额外杂波),TD-AMRKNet能有效去除雨、海杂波,同时完好保留岛屿、船舶等陆地与海上目标。
5. 不同海况下的定量分析:针对时频谱图,研究选取不同海况等级(2级、4级、5级)的数据,通过分析目标感兴趣区域(ROI)的均值、对比度和被去除的能量,定量评估了TD-AMRKNet的适应性。结果表明,处理后ROI均值下降,对比度绝对值显著提升(如从接近0提升到1.1095),说明算法有效抑制了与目标混合的杂波成分,增强了目标与背景的可区分性。同时,被去除的能量值随海况恶化而递减,反映出算法在恶劣海况下采取了更保守的策略,优先保护潜在弱目标信号,体现了其自适应的鲁棒性。
6. 下游检测性能提升:将抑制前后的PPI图像输入YOLOv8检测器的实验表明,经过TD-AMRKNet杂波抑制后的图像,其目标检测性能得到显著提升。在数据集D、E、F上,抑制后图像的mAP、Precision和F1分数均有明显提高,F1-置信度曲线也显示出更高的峰值。这直接证明了TD-AMRKNet的海杂波抑制工作具有重要的实际应用价值,能够为后续的自动目标识别(ATR)系统提供更“干净”的输入,从而提高检测精度和可靠性。
五、 结论与意义
本研究成功提出并验证了TD-AMRKNet这一新颖的海杂波抑制框架。其核心贡献在于: 1. 提出了一种轻量高效的网络架构:基于扩散模型和三元注意力,引入轻量化的多尺度GSConvs和多个子网络,将参数量控制在极低的3.46M,处理速度快(0.0305秒/图),为实际部署提供了可能。 2. 设计了创新的AMRK模块:通过集成多尺度卷积、空间注意力、KAN和通道压缩注意力,并利用门控机制和跨分辨率融合,该模块能有效捕获图像的长程依赖,增强对细节和局部特征的表示,从而在复杂海况下提升杂波抑制和目标区分能力。 3. 构建并扩充了多源雷达数据集:建立了包含时频谱图和PPI图像的六个真实数据集,并利用改进的DCGAN有效扩充了PPI数据,为领域研究提供了有价值的资源。 4. 验证了卓越的性能与泛化能力:实验证明,TD-AMRKNet在多种不同类型和来源的雷达数据上均能取得优异且稳定的杂波抑制效果,其性能在多项指标上超越现有先进方法,并能显著提升下游目标检测任务的性能。
本研究的科学价值在于为海杂波抑制这一经典问题提供了一种融合扩散模型、新型注意力机制和多尺度特征学习的创新深度学习解决方案,推动了雷达智能信号处理的发展。其应用价值在于所提模型具有参数少、速度快、泛化能力强的特点,有望应用于对实时性、计算资源有限制要求的舰载、岸基雷达系统中,提升对海监视与目标探测的能力。
六、 研究亮点
七、 其他有价值内容
论文亦指出了当前工作的局限性与未来方向:TD-AMRKNet尚未针对不同雷达模态设计特定的处理机制,其注意力权重的分配与异构雷达信号的物理特性缺乏显式关联。此外,当前方法基于静态预收集数据集,在需要动态在线处理的应用场景中可能存在延迟。未来的研究将集中于开发模态自适应处理机制、构建与雷达物理特性显式关联的可解释注意力模型,以及增强算法的动态在线处理能力。这些展望为后续研究指明了有价值的探索路径。