基于背景对比注意力机制的无人机脉冲多普勒雷达检测网络

分享自：
基于背景对比注意力机制的无人机脉冲多普勒雷达检测网络

电气科学与工程
工程学
期刊:IEEE Transactions on Aerospace and Electronic SystemsDOI:10.1109/taes.2025.3616274
【点击此处】阅读全文、收藏及针对性提问
基于背景对比注意力的无人机脉冲多普勒雷达检测网络（BCA-DetNet）学术研究报告
第一、研究作者、机构及发表信息 本研究的主要作者是浙江大学电气工程学院的Wenmiao Zhao（赵文淼）、Xiaorun Li（李笑蓉）和Shuhan Chen（陈舒含）。其中，李笑蓉研究员为通讯作者。该研究成果以题为《BCA-DetNet: Background Contrast-based Attention Detection Network for UAVs Detection in Pulse-Doppler Radar》的学术论文形式，于2025年10月2日在线发表在电气电子工程师学会（IEEE）旗下的权威期刊《IEEE Transactions on Aerospace and Electronic Systems》上（第61卷第6期，2025年12月）。该研究得到了中国国家重点研发计划（项目编号：2024YFF1400900）的资助。
第二、研究的学术背景与目标 本研究属于雷达信号处理、目标检测与深度学习交叉的领域，具体聚焦于脉冲多普勒（Pulse-Doppler, PD）雷达对无人机（Uncrewed Aerial Vehicles, UAVs）的检测问题。
研究背景： 无人机在民用和军事领域的广泛应用带来了新的安全挑战。然而，无人机具有“低、慢、小”（低空、慢速、小雷达截面积）的特点，这使得其在雷达检测中面临极大困难。与红外、光电和声学探测相比，雷达具有全天候、全天时工作的优势，是探测无人机的有力工具。在PD雷达中，距离-多普勒图（Range-Doppler Map, R-D Map）是最常用的目标检测数据表示形式。然而，在复杂背景杂波（如海杂波、地杂波、气象杂波）环境下，尤其是低信杂比（Signal-to-Clutter Ratio, SCR）条件下，现有检测方法性能急剧下降。现有方法主要分为两类：基于统计模型的方法（如恒虚警率CFAR检测器）和基于特征的方法（包括传统特征提取和基于深度学习的方法）。基于深度学习的方法因其强大的特征学习能力而展现出潜力，但在应对低SCR下的小目标检测时仍面临挑战。
研究动机与核心洞察： 作者指出，在R-D图中，无人机目标仅占据图中极小部分，累积能量少，而背景杂波则占据了图的绝大部分。传统深度学习模型直接学习目标特征，在目标-背景极度不平衡的情况下，模型容易被占主导地位的背景模式所主导，导致虚警率高。作者由此获得关键洞察：与其直接学习微弱的目标特征，不如主动学习背景杂波的分布特征，并以此在特征维度上抑制背景，从而突出目标。
研究目标： 为了在低SCR场景下降低虚警率（False Alarm Rate, FAR）并保持高检测率（Detection Rate, DR），本研究旨在提出一种新颖的深度学习检测网络。该网络的核心思想是“通过学习背景特征来辅助目标检测”，即首先建模背景，然后在特征层面进行背景抑制，从而提取更纯净的目标信息。
第三、研究的详细工作流程 本研究提出了一种名为背景对比注意力检测网络（Background Contrast-based Attention Detection Network, BCA-DetNet）的端到端检测框架。其工作流程主要包括以下几个关键部分：
1. 整体网络架构： BCA-DetNet借鉴了视觉目标检测领域中的DETR（Detection Transformer）框架，将其首次引入雷达目标检测领域。网络以完整的R-D图作为输入，避免了复杂的预处理和滑动窗口操作。其主干流程为：首先使用卷积神经网络（CNN，如ResNet-50）对R-D图进行初步特征提取；随后，特征图加入位置编码后，送入Transformer编码器。与此同时，一个独立的随机掩码多尺度背景学习器（Random Mask Multiscale Background Learner, RMML）模块处理输入的R-D图块，生成背景特征向量。在Transformer编码器的每个块中，除了标准的多头自注意力（Multi-head Self-Attention, MSA）模块，还嵌入了本研究提出的背景对比注意力（Background Contrast-based Attention, BCA）模块，该模块利用RMML提供的背景特征来抑制编码器特征中的背景成分。最后，Transformer解码器解析处理后的特征，通过前馈网络（Feedforward Network, FFN）直接输出目标的位置和类别预测，实现端到端检测。
2. 随机掩码多尺度背景学习器（RMML）： 该模块是背景特征学习的核心。其设计目的是尽可能排除目标污染，学习纯净背景杂波的分布特征。 * 输入与处理对象： 输入是将R-D图分割成的图块。样本量为模拟生成的6000张R-D图（瑞利分布、对数正态分布、K分布杂波各2000张），以及后续用于测试的真实雷达数据集。 * 关键技术： * 随机掩码（Random Mask）： 受到掩码自编码器（Masked Autoencoder）的启发，在输入卷积层之前，以0.8的高比例随机丢弃部分R-D图块。这基于矩阵补全理论，迫使模型仅依靠未被掩码的背景区域来推断和学习背景分布，从而最大限度地减少目标对背景特征学习的影响。 * 多尺度深度可分离卷积： 为了捕获不同感受野下的背景特征，RMML并行使用了3x3、5x5、7x7三种不同尺寸的深度可分离卷积核。深度可分离卷积能有效减少参数量和计算量。通过不同尺度卷积提取的特征图会被拼接（Concat）并进一步融合。 * 输出： 经过一系列卷积、激活、归一化和池化操作后，RMML输出一个尺寸为1x1x256的背景特征向量。这个向量是对当前R-D图中背景杂波分布的概括性表征，将被送入后续的BCA模块。
3. 背景对比注意力（BCA）模块： 该模块是实现在特征维度抑制背景的关键，位于Transformer编码器内。 * 输入： 两个输入源：一是来自编码器前一层的“目标特征”（可能已被背景污染），二是来自RMML的“背景特征向量”。 * 处理流程： * 特征对齐与拼接： 对目标特征进行下采样，同时将背景特征向量通过卷积和复制操作扩展到与目标特征相同的空间尺寸。然后将二者在通道维度上进行拼接。 * 背景抑制与权重生成： 对拼接后的特征，依次进行像素级最大池化（Pixelwise Max Pooling）和1x1卷积操作。像素级最大池化能保留每个空间位置上最显著（可能是目标）的特征值，而1x1卷积则学习为背景和目标特征分量分配不同的权重。这个过程旨在融合两种特征并抑制背景干扰。 * 注意力权重应用： 将上述操作产生的特征图上采样至原始目标特征的尺寸，并通过Sigmoid函数生成一个空间注意力权重图。该权重图与原始目标特征进行逐元素相乘，从而增强目标区域、抑制背景区域，生成背景抑制后的新目标特征。 * 实验方法： 该模块的效果通过消融实验进行验证，即对比仅使用MSA、仅使用BCA、以及同时使用MSA和BCA（不加和加JS散度损失）几种配置下的检测性能。
4. 损失函数设计： 总损失函数包含两部分： * 匈牙利损失（Hungarian Loss）： 继承自DETR，用于处理目标检测的集合预测问题，包括分类损失和边界框回归损失（结合了L1损失和广义交并比GIoU损失）。 * 詹森-香农散度损失（Jensen-Shannon Divergence Loss, JS Loss）： 本研究新增的关键部分。为了确保BCA模块能有效增大背景特征与处理后的目标特征之间的差异，作者将JS散度引入损失函数。在训练过程中，计算RMML输出的背景特征与BCA模块输出的目标特征（均经过Softmax归一化为概率分布）之间的JS散度，并在总损失中对其取负（L_js = -JS(...) + C）。通过反向传播，该损失项会驱使网络最大化这两个特征分布之间的差异，从而强制BCA模块生成与背景特征迥异的目标特征，从损失函数层面保障了背景抑制的有效性。
5. 实验流程与数据处理： * 数据集： * 模拟数据： 根据PD雷达信号模型（线性调频信号、脉冲压缩、多普勒处理）和三种典型杂波统计模型（瑞利分布、对数正态分布、K分布），生成了包含不同SCR（-30 dB 至 -5 dB）和信噪比（SNR, -10 dB 至 10 dB）的6000张R-D图用于训练和测试。测试时针对不同SCR生成了独立的测试集。 * 真实数据： 采用公开的基于固定翼无人机的雷达实测数据集（Song et al., 2019）来验证模型的泛化能力。 * 对比方法： 选择了三种基线方法进行对比：经典的二维单元平均恒虚警率检测器（2D CA-CFAR）、基于滑动窗口和CNN的检测方法（DCNN）、以及原始的DETR模型。 * 评估指标： 采用了适用于深度学习检测器的改进版检测率（Pd）和虚警率（Pf），其计算基于预测框与真实框之间的欧氏距离是否小于阈值tdis（实验设置为1至5个像素单位）。同时，使用平均最小距离（d_min）来评估定位精度。 * 鲁棒性测试： 额外设计了“少样本”（Fewseen）和“零样本”（Unseen）实验，即分别在训练集中极少或完全不包括某种杂波类型（K分布），然后在完全由该类型杂波构成的测试集上评估，以检验模型对未见过背景的泛化能力。
第四、研究的主要结果 1. 消融实验结果： 在SCR为-5 dB的测试集上（tdis=5），消融实验清晰展示了各模块的作用。 * 仅用MSA模块： 取得Pd=94.44%，Pf=6.70%，性能基准较好。 * 仅用BCA模块： 性能下降至Pd=84.56%，Pf=15.54%，说明单独使用BCA不如MSA。 * 同时使用MSA和BCA模块（无JS损失）： 性能（Pd=93.67%，Pf=6.23%）略低于仅用MSA，表明简单组合未带来增益。 * 同时使用MSA和BCA模块并加入JS损失（完整BCA-DetNet）： 性能达到最佳，Pd显著提升至96.33%，Pf大幅降低至3.13%，且d_min最小。这强有力地证明了BCA模块在JS散度损失的约束下，能够有效抑制背景干扰，提升检测性能并降低虚警。JS散度损失值的收敛曲线也表明，在训练过程中背景与目标特征的差异被成功拉大。
2. 模拟数据对比实验结果： 在SCR从-30 dB变化到-5 dB的广泛测试中，BCA-DetNet展现了显著优势。 * 高SCR场景（如-5 dB）： 所有方法性能均较好，但BCA-DetNet的Pd最高，Pf和d_min最低，表现最优。 * 低SCR场景（如-25 dB）： CA-CFAR和DCNN性能急剧恶化（CA-CFAR的Pf极高，DCNN的Pd很低）。原始DETR性能尚可但不如BCA-DetNet。BCA-DetNet在SCR=-25 dB时仍能保持Pd=81.11%，Pf=9.65%，显示出卓越的鲁棒性。 * 定位精度： 在所有SCR条件下，BCA-DetNet的d_min指标均为最小，证实其目标定位最准确。 * 结果可视化： 对比检测结果图显示，在低SCR的R-D图中，CA-CFAR存在大量虚警和漏检，DCNN漏检严重，而BCA-DetNet和DETR能较好检测目标，且BCA-DetNet的预测框更精准。
3. 真实数据实验结果： 在实测数据集上的测试进一步验证了模型的实用价值。无论是在高SCR还是低SCR的真实场景下，BCA-DetNet都表现出了良好的检测性能。定量结果显示，在高SCR下Pd达到94.8%，在低SCR下仍能保持92.2%的Pd（尽管Pf有所上升），证明了模型从模拟数据到真实数据的有效迁移能力。
4. 鲁棒性测试结果： * 少样本（Fewseen）测试： 在训练集中仅包含200个K分布样本的情况下，在纯K分布测试集上，模型性能相较于在包含所有杂波类型的训练集上训练的结果略有下降，但仍远优于CA-CFAR和DCNN。 * 零样本（Unseen）测试： 在训练集中完全未包含K分布样本的情况下，在纯K分布测试集上，性能较“少样本”场景进一步轻微下降（例如SCR=-25 dB时，Pd从72.66%降至68.33%），但依然显著优于传统对比方法。这表明，尽管未见过特定杂波类型会影响性能，但BCA-DetNet学习的“背景抑制”能力具有一定的泛化性。
第五、研究结论与价值 本研究成功提出并验证了BCA-DetNet，一种用于低SCR环境下无人机雷达检测的新型端到端深度学习网络。
结论： 通过设计RMML模块学习背景杂波分布，并结合BCA模块及JS散度损失在特征维度实现有效的背景抑制，BCA-DetNet能够在极低信杂比条件下，实现高检测率和低虚警率的平衡，并具备精确的目标定位能力。实验表明，该方法在模拟和真实数据上均优于传统的CFAR算法和已有的深度学习检测方法。
价值： * 科学价值： 1) 研究范式创新： 首次将“学习背景以辅助检测”这一逆向思维系统性地引入雷达深度学习检测领域，并提供了完整的实现框架（RMML+BCA+JS Loss）。2) 方法创新： 首次将DETR框架应用于雷达目标检测，展示了Transformer结构在该领域的潜力；提出的RMML和BCA模块为解决目标-背景不平衡问题提供了新工具。3) 理论贡献： 创造性将JS散度作为损失函数的一部分，从分布差异的角度约束特征学习，为深度学习在特征分离任务中的应用提供了新思路。 * 应用价值： 所提方法显著提升了雷达在复杂杂波环境下对“低、慢、小”无人机目标的检测性能，特别是大幅降低了虚警率，这对于构建可靠的城市低空安防、战场感知等实际系统具有重要的工程应用前景。
第六、研究亮点 1. 核心思想新颖： 突破了深度学习检测器直接学习目标的常规思路，开创性地提出“建模并抑制背景”作为提升低SCR下小目标检测性能的途径。 2. 模块设计精巧： RMML模块结合高比例随机掩码和多尺度卷积，有效学习纯净背景特征；BCA模块巧妙融合背景与目标特征，通过像素级操作生成目标聚焦的注意力图。 3. 损失函数创新： 引入JS散度损失作为驱动背景抑制的“引擎”，从优化目标上确保特征分离的有效性，这是方法成功的关键。 4. 系统性验证充分： 不仅进行了全面的消融实验和性能对比，还设计了“少样本”和“零样本”鲁棒性测试，深入评估了模型的泛化能力，论证严谨。 5. 端到端与实用性： 基于DETR实现端到端检测，避免了复杂的预处理和后处理流程，并以完整的R-D图作为输入，更贴近实际应用场景。
第七、其他有价值内容 本研究对雷达信号模型（目标回波、三种杂波分布）进行了清晰的数学建模，为生成高质量的模拟训练数据奠定了基础。文中对相关工作的综述涵盖了从传统CFAR到各类深度学习方法的演进，为读者提供了该领域的良好背景知识。同时，作者对评估指标（Pd, Pf, d_min）的重新定义和解释，贴合了深度学习检测器的输出特点，使性能评估更为合理和准确。这些内容共同构成了一项完整、深入且具有影响力的研究工作。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问