分享自:

基于细节增强卷积和内容引导注意力的单图像去雾方法

期刊:IEEE Transactions on Image ProcessingDOI:10.1109/TIP.2024.3354108

基于细节增强卷积和内容引导注意力的单幅图像去雾研究:DEA-Net

作者及机构
本研究的通讯作者为浙江大学航空航天学院的Zhe-Ming Lu(IEEE高级会员),第一作者Zixuan Chen与共同第一作者Zewei He均来自同一机构。该研究发表于2024年的IEEE Transactions on Image Processing(第33卷),DOI编号10.1109/TIP.2024.3354108,并获得中国国家自然科学基金(52305590)、国家重点研发计划(2020AAA0140004)等多项资助。


学术背景

研究领域与动机
单幅图像去雾(single image dehazing)是低层视觉中的经典病态问题,旨在从雾霾污染的观测图像中恢复清晰场景。尽管基于深度学习的去雾方法(如FFA-Net、AECR-Net)通过增加卷积网络的深度或宽度提升性能,但传统卷积神经网络(CNN)在特征表达能力计算效率上仍存在局限:
1. 普通卷积(vanilla convolution)的局限性:传统卷积倾向于强调低频信息(如光照和颜色分布),而忽略高频细节(如边缘和纹理),导致去雾结果模糊;
2. 雾霾非均匀性(haze non-uniformity):现有方法多关注图像层面的雾霾分布差异,而忽视特征通道间的雾霾编码差异。

研究目标
团队提出DEA-Net(Detail-Enhanced Attention Network),通过细节增强卷积(DEConv)内容引导注意力(CGA)模块,实现高效的高质量去雾,同时保持轻量化设计(仅3.653M参数)。


研究方法与流程

1. 细节增强卷积(DEConv)

设计原理
DEConv由5个并行卷积层构成:1个普通卷积(VC)和4种差异卷积(Difference Convolution, DC),包括中心差分卷积(CDC)、角度差分卷积(ADC)、水平差分卷积(HDC)和垂直差分卷积(VDC)。差异卷积通过计算像素对的梯度差异(如HDC模拟Sobel算子),显式编码先验信息(如边缘增强)。

重参数化技术(re-parameterization)
训练阶段:5个卷积核独立更新参数;
推理阶段:通过线性叠加将5个卷积核合并为单一标准卷积核(公式1),使DEConv与普通卷积的参数量和计算成本一致,但特征提取能力显著提升。

实验验证
在SOTS-Indoor数据集上,替换普通卷积为DEConv的模型(model_fab_d)比基线(base_fab)PSNR提升0.6 dB(表I),特征可视化显示DEConv输出的边缘纹理更清晰(图8)。

2. 内容引导注意力(CGA)

两阶段生成机制
1. 粗粒度SIM生成:结合通道注意力(SE模块)和空间注意力(CBAM模块)生成初始空间重要性图(Spatial Importance Map, SIM);
2. 细粒度SIM优化:通过通道混洗(channel shuffle)和分组卷积,利用输入特征逐通道优化SIM,最终得到通道专属的权重图(公式4)。

优势
- 解决特征层面的雾霾非均匀性;
- 在SOTS-Indoor数据集上,CGA使PSNR进一步提升1.5 dB(表IV),且生成的SIM能更精准定位雾霾区域(图9)。

3. CGA混合融合方案

针对编码器-解码器架构中浅层与深层特征感受野失配问题,提出基于CGA的自适应融合策略:
1. 使用CGA计算空间权重;
2. 加权融合浅层细节特征(flow)和深层语义特征(fhigh)(公式5)。
该方案比普通加法或拼接融合PSNR提升0.1 dB以上(表V)。

4. 整体架构(DEA-Net)

  • 三级U-Net结构:编码器(Level 1-2使用DEB模块)、特征转换层(Level 3使用DEAB模块)、解码器;
  • 训练损失:L1损失函数(公式6);
  • 数据集:RESIDE(ITS/OTS训练集,SOTS测试集)和Haze4K。

主要结果

  1. 定量指标
    • SOTS-Indoor:PSNR 41.16 dB(优于FFA-Net的36.39 dB和Dehamer的38.17 dB);
    • 参数量仅3.653M,推理速度最快(表VII);
  2. 定性效果:恢复的边缘更锐利,且无颜色失真(图10-12);
  3. 消融实验:DEConv和CGA分别贡献0.6 dB和1.5 dB的PSNR提升(表I、IV)。

结论与价值

科学价值
1. 首次将差异卷积引入去雾领域,通过先验编码增强高频细节恢复;
2. 提出通道专属的注意力机制(CGA),解决特征级雾霾非均匀性问题;
3. 重参数化技术在去雾任务中的首次应用,实现性能与效率的平衡。

应用价值
DEA-Net可作为高级视觉任务(如目标检测)的预处理模块,其轻量化设计适合部署在移动设备。


研究亮点

  1. 创新性方法:DEConv融合梯度先验,CGA实现通道自适应的特征校准;
  2. 高效性:通过重参数化技术,DEA-Net在PSNR超过41 dB的同时保持低计算开销;
  3. 通用性:CGA模块可迁移至其他图像复原任务(如超分辨率)。

局限与展望
当前模型在真实场景(非合成数据)中存在域偏移问题,未来计划结合量化压缩技术进一步优化效率。

(注:文中图表及参考文献详见原论文)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com