本文由Chengyang Li(北京大学/军事科学院系统工程研究所)、Heng Zhou(西安电子科技大学/军事科学院系统工程研究所)、Yang Liu、Caidong Yang、Yongqiang Xie、Zhongbo Li(军事科学院系统工程研究所)及Liping Zhu(中国石油大学(北京))合作完成,发表于2023年7月的IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)第45卷第7期,论文标题为《Detection-Friendly Dehazing: Object Detection in Real-World Hazy Scenes》。
科学领域:本研究属于计算机视觉中的低层图像增强(low-level image enhancement)与高层目标检测(high-level object detection)的交叉领域。
研究动机:真实雾天场景会严重降低基于深度学习的目标检测模型性能。传统解决方案分为两类:
1. 分步策略:先对雾图进行去雾复原,再输入预训练检测模型(图1b),但复原标签(如清晰图像)在真实场景中难以获取;
2. 联合训练:同时优化去雾和检测模块(图1c),但两者目标冲突——去雾关注全局图像质量,而检测聚焦目标区域特征,导致性能不佳。
研究目标:提出无需复原标签的端到端联合网络BAD-NET,通过去雾模块与检测模块的协同优化,实现检测友好的去雾(detection-friendly dehazing),提升雾天条件下的目标检测精度。
BAD-NET总体结构(图2):
- 双分支并行结构:
- 分支1:直接提取雾图特征(保留原始雾天信息);
- 分支2:先通过去雾模块处理雾图,再提取去雾后特征;
- 注意力融合模块(Attention Fusion Module):通过空间-通道联合注意力机制(图5)动态融合两分支特征,缓解去雾失败时对检测的负面影响。
去雾模块(图3):
- 改进AOD-Net的大气散射模型,将透射率图( t(x) )和大气光( a )统一为可学习参数( \omega );
- 引入多尺度空洞卷积(dilated convolution)增强感受野,适应不同浓度的雾霾。
检测模块:基于轻量化Faster-RCNN(MobilenetV3-large骨干网络),保留经典区域提议网络(RPN)结构。
雾霾鲁棒损失(HR Loss)(图7):
- 约束去雾特征与原始雾图特征在检测骨干中的相似性(KL散度度量),使检测模块对雾霾浓度变化具有鲁棒性。
- 总损失函数:( L{total} = L{det} + \alpha L_{hr} ),其中( \alpha=0.001 )(通过消融实验确定)。
数据精炼流程(算法1-2):
- 偶数轮:在原始雾天数据集上训练;
- 奇数轮:用上一轮训练的去雾模块生成去雾图像,通过雾霾添加算法生成多浓度雾图(模拟真实雾天分布),构成精炼数据集继续训练。
- 作用:避免去雾模块引入的随机噪声干扰检测模块,增强模型泛化能力。