朱德燕、敖咏琪、徐家一、李承城、张钰凡等研究者(来自南京航空航天大学航天学院及空间光电探测与感知工信部重点实验室)于2024年12月在《Optics and Precision Engineering》(光学 精密工程)第32卷第23期发表了一项关于宽波段小目标实时去模糊的原创研究。该研究针对天基平台远距离运动目标探测中的图像模糊问题,提出了一种结合注意力机制的多尺度多阶段卷积神经网络方法(MSSANet),在红外与可见光波段均实现了优于现有算法的实时去模糊效果。以下是研究的详细内容:
天基平台在远距离运动目标探测中面临核心挑战:目标尺寸小(像素占比不足0.1)、波段跨度大(红外与可见光)、图像因运动模糊和衍射模糊严重退化。传统方法(如非盲去模糊和盲去模糊)依赖模糊核估计,计算效率低且易产生振铃效应;而现有深度学习方法(如GAN、RNN、Transformer)在实时性、波段泛化性或小目标轮廓恢复能力上存在局限。研究团队提出通过轻量化网络架构与注意力机制结合,实现34帧/秒以上的实时去模糊,并提升跨波段的适应性。
研究提出多尺度多阶段网络(Multi-Scale Multi-Stage Network, MSSN)作为基础框架,包含从粗到细的3个尺度(S1、S2、S3),分别对应1、2、3个阶段。每个阶段由编码器-解码器模块(Encoder-Decoder, E-D)构成,通过残差块(Residual Block)减轻梯度消失问题。网络输入单幅模糊图像后,通过pixel-unshuffle操作逐级下采样提取多尺度特征,最终输出复原图像。关键创新包括:
- 轻量化模块优化:实验表明,当注意力模块数量为4、残差块数量为2时,PSNR与运行时间达到最优平衡(耗时仅典型算法的1/3,0.029秒/帧)。
- 跨波段通道设计:输入输出通道数固定为3,兼容单通道红外和三通道可见光图像,避免色彩信息丢失。
损失函数结合内容损失(L1损失)与频率重构损失(频域L1差异),权重系数λ=0.1。训练使用Adam优化器(初始学习率1×10⁻⁴,β1=0.9,β2=0.999),在GoPro数据集预训练后,于自建红外(180幅)和可见光(1,130幅)小目标数据集微调,模糊核覆盖运动模糊、衍射模糊及混合类型(图5)。
单独添加CBAM或F-D模块可提升PSNR约0.1 dB,联合使用后红外PSNR提高至32.083 dB(表5),证实注意力机制在多尺度特征融合中的协同作用。
该研究的局限性在于未考虑极端低光照条件下的去模糊需求,未来可结合噪声建模进一步优化。