本研究是一篇发表在IEEE Transactions on Aerospace and Electronic Systems期刊2022年第00期(实际在线出版时间为2025年)的原创研究论文,题为“Open-Set Classification of Maritime Radar Small Targets Using OpenMax Layer and Supervised Variational Auto Encoder”(使用OpenMax层和监督变分自动编码器的海事雷达小目标开集分类)。文章的主要作者为Jing-Yi Li, Bo-Wei Fang, Peng-Lang Shui(通讯作者)和Shu-Wen Xu,他们均来自西安电子科技大学雷达信号处理国家重点实验室。该研究得到了国家自然科学基金等多个项目的支持。
一、 研究的学术背景与目标
本研究的核心科学领域是雷达信号处理,具体聚焦于高分辨率海事雷达小目标智能识别中的开集分类(Open-Set Classification, OSC)问题。
研究的现实背景在于:现代高分辨率海事雷达能够获取目标的长时间回波序列,从中可以提取目标的时频分布图像(Time-Frequency Distribution, TFD)作为分类特征。然而,海洋环境复杂,存在各种各样的小目标(如不同类型的水面漂浮物、低空无人机等)。在实际应用中,雷达系统在运行时不可避免地会遇到训练阶段未曾出现过的、来自未知类别(Unknown Class) 的目标。传统的闭集分类器(Closed-Set Classifier, CSC) ,如使用Softmax输出的深度神经网络,会将整个特征空间划分为已知类别的决策区域,因此必然会将未知类别的目标强行误分类为某个已知类别,导致严重的信息误导和潜在的安全风险。这种在测试阶段存在未知类别样本的场景,即为开集分类问题。解决该问题的关键,是要求分类器不仅能够准确识别已知类别,还要具备对未知类别样本的拒识(Rejection) 能力。
因此,本研究的目标是:提出一种新的开集分类方法,专门用于处理海事雷达小目标的识别问题。该方法需要能够有效利用标准化时频分布图像,在保证已知类别分类精度的同时,实现对未知类别目标的可靠拒识。
二、 研究的具体工作流程
本研究的工作流程是一个精心设计的、集成了多个模块的深度学习系统。其核心是一个双通道网络架构,整体流程可概括为:数据预处理、模型构建与训练、以及测试决策。
1. 数据预处理:标准化时频分布图像的生成 研究的数据来源包括三个公开雷达数据库(IPIX, CSIR, RDS)和一个实测X波段雷达数据库。目标主要为点状小目标,例如漂浮球、浮筒、浮标、移动小船和低空无人机等。原始雷达回波数据经过检测和跟踪后,提取目标的时间序列。 * 关键输入:研究不使用原始高分辨距离像(HRRP)或SAR/ISAR图像,而是采用标准化时频分布图像作为输入。这是因为小目标缺乏空间散射结构,但其雷达截面积(RCS)起伏和运动信息蕴含在时频特征中。通过平滑伪Wigner-Ville分布(SPWVD) 计算得到初始TFD图像。 * 标准化步骤:为防止不同雷达参数对分类器造成“印记”干扰,确保分类器的泛化能力,研究采用了严格的TFD图像标准化三步法:(1) 坐标标准化:将雷达慢时间和多普勒频率转换为物理的时间和速度单位;(2) 尺寸标准化:通过多速率滤波、插值和抽取,将所有图像统一到标准尺寸;(3) 灰度标准化:通过直方图均衡化处理强度,以减少信杂比和目标距离对图像特征的影响。最终生成大小统一的标准化TFD图像作为分类器的输入。
2. 双通道模型构建 研究提出的开集分类器结构如下图所示(参考原文Fig.5),包含一个训练分支和一个工作分支。 * 上通道:闭集分类器(ResNet)。此通道采用一个预先训练好的基于ResNet的闭集分类器。该分类器使用[5]中提出的改进焦点损失函数进行训练,专门用于对已知类别的标准化TFD图像进行高精度分类。其输出为传统的Softmax分数。虽然该通道本身不具备拒识能力,但它为整个系统提供了初步的分类置信度,并将训练样本分为“正确分类样本集”和“错误分类样本集”,其中正确分类样本集将被用于后续构建开集决策。 * 下通道:监督变分自编码器特征提取器(Supervised VAE Feature Extractor)。这是本研究的核心创新模块之一。传统变分自编码器(VAE)是无监督的,其目标是学习数据的紧凑表示和生成。为了适应开集分类的需求,研究者对VAE进行了监督学习改造。 * 结构:监督VAE同样包含编码器和解码器。编码器将高维TFD图像映射到一个低维的潜在特征空间。 * 创新损失函数:这是该模块的灵魂。研究者在标准VAE的损失函数(包含重建损失和KL散度损失)基础上,引入了三个新的监督损失项: 1. Lc (分类损失):采用交叉熵形式,目的是增大不同已知类别特征之间的类间距离。 2. Ld (类内紧凑损失):最小化每个已知类别内部样本到其类原型的距离,使同类特征更紧凑。 3. Ls (空间分布损失):驱使所有已知类别的类原型远离特征空间的共同中心,同时最大化类原型之间的距离。这一设计基于一个关键观察:在仅用已知类别数据训练的特征空间中,未知类别的样本倾向于分布在特征空间的中心区域。因此,将已知类别的特征“推向”外围,就能为中心区域留出空间,便于拒识未知类别。 * 作用:通过联合优化这五个损失项(L_vae, Lc, Ld, Ls),监督VAE编码器能够提取出既具有强判别性(类间分离、类内紧凑)又为未知类别预留了拒绝空间的低维特征向量。
3. 开集决策:改进的OpenMax层 这是本研究的另一个核心创新点。研究将上通道的Softmax分数与下通道提取的特征信息融合,通过一个改进的OpenMax层进行最终决策。 * 特征建模:在下通道提取的低维特征空间中,对每个已知类别进行建模。计算每个类别的类原型(均值向量) 和协方差矩阵。然后,计算每个已知类别中正确分类样本到其类原型的马氏距离,并对这些距离的“尾部”(即最大的一部分距离)拟合威布尔极值分布,以描述类别的边界特性。 * 决策融合:对于一个测试样本,首先通过上通道ResNet得到Softmax分数(s_i),同时通过下通道监督VAE得到其特征向量。接着计算该特征向量到各个已知类原型的马氏距离,并利用拟合的威布尔分布计算出该样本属于每个已知类别的概率(ω_i,与距离负相关)。 * 改进的OpenMax分数修正:将原始的Softmax分数与距离概率相结合,得到修正后的分数:š_i = s_i * ω_i。同时,计算一个代表“未知类别”的分数:š_unknown = 1 - Σ š_i。 * 最终决策:根据修正后的分数(š_1, š_2, …, š_known, š_unknown)进行决策。可以选择最大分数对应的类别(若未知类别分数最高则拒识),也可以设定一个阈值来控制拒识率。
三、 研究的主要结果与分析
研究者设计了详尽的实验来验证所提方法的有效性,主要结果和分析如下:
1. 监督VAE特征提取器的有效性验证(消融实验) 研究首先通过二维特征可视化,直观展示了改进损失函数中各个项的作用。 * 仅使用标准VAE损失(L_vae)时,三个已知类别的特征在空间中混杂,无法分离。 * 加入分类损失(Lc)后,类别间开始分离,但类内特征仍较分散,且类中心靠近特征空间原点。 * 再加入类内紧凑损失(Ld)后,同类特征变得非常紧凑。 * 最后加入空间分布损失(Ls)后,三个已知类别的特征不仅类内紧凑、类间分离,而且被推离特征空间中心,形成一个围绕中心的、相对空旷的区域,这为未知类别的拒识创造了理想条件。这一系列可视化实验强有力地证明了所提监督VAE设计理念的正确性。
2. 参数与性能分析 研究对多个关键参数的影响进行了系统分析。 * 潜在特征维度:实验发现,使用二维特征空间在综合性能(MAF1)和稳定性上取得了较好的平衡,过高维度可能导致过拟合。 * 距离度量与极值样本比例(η):研究对比了欧氏距离和马氏距离。结果表明,在特征存在相关性的情况下,使用马氏距离能显著提升分类准确率和MAF1分数。对于控制威布尔分布拟合的极值样本比例η,研究发现η在0.2到0.3之间时,能在已知类别分类精度和未知类别拒识能力之间取得良好平衡。 * 损失函数权重优化:研究者提出了一种经验性的权重调优方法,通过观察训练收敛后各损失项的量级,按比例调整其权重,使模型在平衡的损失函数下重新训练,从而获得更优的特征分布。
3. 系统性消融实验与性能对比 研究将所提方法分解为多个改进步骤,并与基准方法和其他先进开集分类方法进行了全面对比。 * 系统性消融:从原始的OpenMax(使用欧氏距离)开始,逐步添加马氏距离、标准VAE、以及监督VAE的各项损失。实验结果(见原文表IV)清晰显示,每一步改进都带来了性能提升。最终完整的方法(使用马氏距离和监督VAE的全部三个新损失项)在所有三个测试数据集上都取得了最佳的或接近最佳的准确率和MAF1。 * 与主流方法对比:研究将所提方法与L-Softmax、CROSR、C2AE、GCPL、TANE、KPF等六种先进开集分类方法在五个不同开放度的数据集上进行了比较。结果显示(见原文表VI),所提方法在五个数据集中的四个上取得了最高的宏观平均F1分数(MAF1),并且在平均分类准确率上也名列前茅(第二)。特别值得注意的是,一些方法(如L-Softmax)虽然平均准确率最高,但其MAF1分数很低,说明其高准确率是以牺牲拒识能力为代价的。而所提方法在保持高准确率的同时,实现了优秀的拒识能力,体现了其综合性能的优势。 * 计算效率:论文报告了决策时间,经过标准化的TFD图像计算和整个开集决策流程,单次决策时间在0.7秒以内,满足实际应用需求。 * 跨雷达验证:一个额外的实验表明,使用IPIX数据库数据训练的模型,能够成功识别来自另一部岛屿雷达实测的、同为“锚定漂浮小目标”的铁鼓数据,证明了方法的泛化能力和跨雷达应用潜力。
四、 研究的结论与意义
本研究成功提出并验证了一种用于海事雷达小目标识别的、高效的双通道开集分类方法。该方法创造性地将闭集ResNet分类器、带有新型监督损失函数的变分自编码器特征提取器以及基于马氏距离的改进OpenMax决策层有机结合。
结论:该方法能够将标准化TFD图像映射到一个具有理想几何特性的低维特征空间(已知类别类内紧凑、类间分离、且远离中心),并在此空间上构建统计模型,结合深度网络的软得分,实现对已知类别的高精度分类和对未知类别的有效拒识。在包含多个公开和实测雷达数据库的综合测试集上,该方法展现了优越的综合性能。
价值: 1. 科学价值:为雷达目标识别领域,特别是小目标和开集分类这一难点问题,提供了一套新颖且有效的解决方案。其中监督VAE特征提取器的设计思想(通过特定损失函数塑造特征空间的几何分布)和融合马氏距离的OpenMax改进策略,对相关研究具有启发意义。 2. 应用价值:直接面向高分辨率海事雷达的实战需求。所提方法使雷达系统在复杂海洋环境下运行时,不仅能识别已知的典型目标,还能警惕并拒识未知的、可能具有高威胁的目标,提升了雷达系统的智能化水平和态势感知的可靠性。标准化TFD图像的使用也增强了算法对不同雷达平台的适应性。
五、 研究的亮点
六、 其他有价值内容
研究中对“标准化TFD图像”重要性的强调和具体标准化流程的阐述,对于雷达目标识别,特别是希望算法具备泛化能力的研究者而言,具有很高的参考价值。它指出并解决了一个容易被忽视但至关重要的问题——如何剥离传感器特异性,让模型学习目标本身的本质特征。