分享自:

检测友好的去雾:真实世界雾天场景中的目标检测

期刊:ieee transactions on pattern analysis and machine intelligenceDOI:10.1109/tpami.2023.3234976

学术报告:BAD-NET——面向目标检测友好的真实世界雾天场景去雾方法研究

一、作者与发表信息

本文由Chengyang Li(北京大学/军事科学院系统工程研究所)、Heng Zhou(西安电子科技大学/军事科学院系统工程研究所)、Yang Liu、Caidong Yang、Yongqiang Xie、Zhongbo Li(军事科学院系统工程研究所)及Liping Zhu(中国石油大学(北京))合作完成,发表于2023年7月的IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)第45卷第7期,论文标题为《Detection-Friendly Dehazing: Object Detection in Real-World Hazy Scenes》。


二、研究背景

科学领域:本研究属于计算机视觉中的低层图像增强(low-level image enhancement)高层目标检测(high-level object detection)的交叉领域。

研究动机:真实雾天场景会严重降低基于深度学习的目标检测模型性能。传统解决方案分为两类:
1. 分步策略:先对雾图进行去雾复原,再输入预训练检测模型(图1b),但复原标签(如清晰图像)在真实场景中难以获取;
2. 联合训练:同时优化去雾和检测模块(图1c),但两者目标冲突——去雾关注全局图像质量,而检测聚焦目标区域特征,导致性能不佳。

研究目标:提出无需复原标签的端到端联合网络BAD-NET,通过去雾模块与检测模块的协同优化,实现检测友好的去雾(detection-friendly dehazing),提升雾天条件下的目标检测精度。


三、研究方法与流程

1. 网络架构设计

BAD-NET总体结构(图2):
- 双分支并行结构
- 分支1:直接提取雾图特征(保留原始雾天信息);
- 分支2:先通过去雾模块处理雾图,再提取去雾后特征;
- 注意力融合模块(Attention Fusion Module):通过空间-通道联合注意力机制(图5)动态融合两分支特征,缓解去雾失败时对检测的负面影响。

去雾模块(图3):
- 改进AOD-Net的大气散射模型,将透射率图( t(x) )和大气光( a )统一为可学习参数( \omega );
- 引入多尺度空洞卷积(dilated convolution)增强感受野,适应不同浓度的雾霾。

检测模块:基于轻量化Faster-RCNN(MobilenetV3-large骨干网络),保留经典区域提议网络(RPN)结构。

2. 自监督损失函数

雾霾鲁棒损失(HR Loss)(图7):
- 约束去雾特征与原始雾图特征在检测骨干中的相似性(KL散度度量),使检测模块对雾霾浓度变化具有鲁棒性。
- 总损失函数:( L{total} = L{det} + \alpha L_{hr} ),其中( \alpha=0.001 )(通过消融实验确定)。

3. 间隔迭代训练策略

数据精炼流程(算法1-2):
- 偶数轮:在原始雾天数据集上训练;
- 奇数轮:用上一轮训练的去雾模块生成去雾图像,通过雾霾添加算法生成多浓度雾图(模拟真实雾天分布),构成精炼数据集继续训练。
- 作用:避免去雾模块引入的随机噪声干扰检测模块,增强模型泛化能力。


四、实验结果

1. 数据集
  • RTTS:4322张真实雾天交通场景图像,含5类目标(行人、自行车等);
  • VOC-Haze:基于PASCAL VOC合成的雾天数据集,含10种雾浓度等级。
2. 性能对比
  • 对比方法
    • 直接检测(Baseline-1);
    • 分步策略(AOD-Net+预训练检测器);
    • 联合训练(CascadeNet、DS-Net、IA-YOLO)。
  • 结果(表II):
    • BAD-NET在RTTS和VOC-Haze上的mAP(mean Average Precision)分别达58.3%64.7%,显著优于其他方法;
    • 消融实验(表III):双分支结构(+3.1 mAP)、HR损失(+1.89 mAP)、迭代训练(+1.83 mAP)均贡献显著。
3. 可视化分析
  • 注意力融合效果(图10):相比SK-Net和AFF模块,BAD-NET的注意力图更精准定位目标区域;
  • 困难样本检测(图9):对远处小目标和重度遮挡目标的性能仍有提升空间。

五、研究结论与价值

1. 科学价值
  • 理论贡献:首次在无清晰图像标签条件下,建立了去雾与目标检测的正向关联机制;
  • 方法论创新:双分支结构、HR损失和迭代训练策略为解决类似低层-高层任务联合优化提供了范式。
2. 应用价值
  • 实际场景适配性:适用于自动驾驶、监控等真实雾天环境;
  • 实时性:参数量仅增加175k,推理速度达5ms/帧(NVIDIA 3090 GPU)。
3. 局限性
  • 深度估计依赖合成雾霾数据,真实雾浓度分布建模仍有改进空间;
  • 对极端雾浓度(如浓雾)的检测性能待优化。

六、研究亮点

  1. 检测友好去雾:通过自监督HR损失约束去雾方向,避免传统复原损失与检测目标的冲突;
  2. 弱监督训练:仅需雾天图像和检测标签,无需配对清晰图像;
  3. 轻量化设计:模块化结构易于替换(如替换骨干网络为YOLO或Transformer)。

七、未来方向

  • 利用强化学习进一步关联检测损失与复原损失;
  • 设计基于目标区域的局部复原质量评估损失。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com